» ブログ校正用ブックマークレット» IE8用アクセラレーター new!
2008年6月19日から8月28日までの間に収集した、当ツールにおける解析結果の統計情報をまとめておきます(現在はデータの収集を終了しています)。この期間内に当ツールをご利用いただいた多くの皆さま、心より御礼申し上げます。
※営業行為を目的とした資料に用いることはお断りしますが、それ以外の引用については特にご連絡いただく必要はありません。引用の際は、このページのURL(Webの場合はリンクも)、及び、当ツールの制作者(松下健次郎)の氏名を「引用元」として記載してください。
2008年6月19日から2008年8月28日までの間にかけて、以下の情報を収集しました。期間内、本ツールを使った解析の全てを対象にしています。
期間内の総解析回数は15914回、そのうち1つでも問題が見つかったものが10296回です。
解析結果全体を通して、延べ52074点の問題が見つかりました。
当ツールの大分類でみると、「基本」に該当する問題が3413点(7%弱)、「難読」に該当する問題が34072点(約65%)、続いて「品質」に該当する問題が14589点(約28%)となっています。
小分類別の内訳は以下の通りです(割合順)。
| 種目 | 該当点数 | 問題全体に対する割合 |
|---|---|---|
| 合計 | 52074 | 100.00% |
| 一般的にはより平易な表記が望ましい言葉 | 24200 | 46.47% |
| 助詞不足 | 13685 | 26.28% |
| 常用漢字表外の漢字 | 6537 | 12.55% |
| 略語 | 2610 | 5.01% |
| 機種依存文字(環境依存文字) | 1943 | 3.73% |
| 仮名表記が望ましい当て字 | 725 | 1.39% |
| 禁忌・不快語 | 530 | 1.02% |
| 冗長表現 | 486 | 0.93% |
| 二重否定 | 418 | 0.80% |
| 誤字・誤変換 | 332 | 0.64% |
| 固有名詞表記の間違い | 180 | 0.35% |
| 登録商標など不用意に使うべきでない用語 | 127 | 0.24% |
| ら抜き言葉 | 118 | 0.23% |
| 言葉の誤用 | 98 | 0.19% |
| 外国地名表記の間違い | 82 | 0.16% |
| 人名表記の間違い | 3 | 0.01% |
解析全体で10178語句が「問題のあるもの」として検出されました。参考までに上位100位までの語句を掲載しておきます。
おかげさまで、いち編集ライターとしては大変参考になる資料が手に入りました。今回収集したデータは、当ツールのバージョンアップを検討する上での資料として、ベースとなるシステムを無償提供しているYahoo!JAPANに機能改善のリクエストを送る際の根拠として、当方の執筆活動・講演活動上のネタとして、その他様々な形で活用させていただく予定です(利用者を特定できる情報・利用者の著作権を侵すような情報は収集していませんので、どうぞご了承のほどを)。
もっとも、取得した情報の種類が少なすぎて、本格的な研究・マーケティングに役立つデータにならなかったことは、少々反省です。
たとえば、「2.標本数」を元に計算すると、チェックした文章の約3分の2に何らかの問題が見つかったことになります。また、「3.検出された問題の内訳」なども併せて考えると、チェックした文章1本あたり3.3箇所の問題が含まれていたことになります。しかし、以下のような理由から、単純に「一般的な原稿の約3分の2には何らかの問題がある」「一般的な原稿には約3~4箇所の要修正箇所がある」と結論づけることはできません。
思いつくだけでも、他にもいろいろ考えなければならないことがあります。本レポートは、あくまで限定された状況下における一つの「傾向」を知るための資料でしかないことを、どうぞお忘れなく。
まあ、元々それほど深い考えでデータを取り始めたわけではないので、現状でも大満足なのですが…ユニークユーザー数とか、解析された文章の文字数とか、1リクエスト当たりの問題の数とか、簡単に取得できる情報がまだまだあるので、そのうちまた時間があるときにでも、細部を見直して、調査を再開したいと思います。その際はアナウンスしますので、是非またご協力の程を。
もし、当ツールや類似のツールを使った統計情報の取得に興味をお持ちの研究者の方がいたら、どうぞお気軽に声をお掛けください。何かしらお助けいただけるのであれば、何かしらお手伝いさせていただく所存です。
文 : 2008/8/31 松下健次郎