
最近、日本十進分類カルタや100マスNDCを作って遊んでいて「これ結構分類ごとに本の出版される数、偏ってそうだな」と思ったので調べてみました。
イワズモガナーですが、分類は新しい本だけではなく、これまでに世に出て所蔵している本すべてに適用するためのものなので、最近の出版点数を調べたところで「でってぃう」なんですが、調べてみたくなったので調べた次第です。
私の予想だと、49*の「医学・薬学」とか76*の「音楽」が多いんじゃないかなぁ、53*の「養蚕業」は流石に少ないんじゃないんかなぁと思って調べ始めたのですが、どうでしょうか。
調べ方
最初はCiNii BooksのAPIを使えば、(ChatGPTが)Pythonのコード書くだけで一瞬で調べられるじゃんと思ったのですが、ちょっと調べたところ、CiNii Booksの分類検索はNDCだけでなく、目録に登録されている他の分類の情報も一緒に検索してしまうので、これじゃあ今回の調査には適していないなと思いました。よく考えるとそもそもCiNii Booksは基本的に大学等図書館に所蔵された本しか検索できないので、そういう意味でもちょっと違うなと後から気づきました。
どうしよっかなと思って国立国会図書館サーチを見てみたところ、NDC分類を指定して検索できたので、そちらで一つ一つ確かめました。
検索条件
対象:国立国会図書館
資料種別:「図書」のみ
出版年:2015年〜
NDC:(2桁の数)*
結果
結果がこちらです。縦の列が日本十進分類の類(百の位)、横の行が綱(十の位)を表しており、その交点のマスに該当の分類の出版点数を記載しています。(例:縦が「2」、横が「1*」のマスは「21*(日本史)」の出版点数、カーソルをあわせると分類が表示されます)
普通に「91*(日本文学)」は忘れていて「あ、そっかー」となったのですが、「72*(絵画)」の17万点は最初バグったのかと思いました。
世の賢明な図書館員の方はすぐに察せられると思うのですが、これは「72*(絵画)」には下位の分類として「726:漫画、〜」があるからなんですねー。大学図書館員なのでこれはわからなくても仕方ない。

出版点数の多いもの・少ないものベスト10
ついでに出版点数の多かった分類、少なかった分類のトップ10の表を作ってみました。
| 順位 | 多い分類 | 少ない分類 |
|---|
「37*(教育)意外と頑張ってるなー」とか「09*はそういうものなの?」とか、これだけで一生味がするのですが、キリがないのでこの辺で。
今回もヒートマップの作成や、ベスト10の作成はChatGPTが一瞬でやってくれました。ベスト10のテーブルも直書きじゃなくてJavaScriptで生成なんだぁというところに驚かされました。(というか、今調べたらNDLサーチも普通にAPIありました。。そりゃそうですよね。。)
お相手は、やわらか図書館学でした。
参考