ホーム » 社情の日常

カテゴリー別アーカイブ: 社情の日常

うわさについての取材

 3月上旬からツイッターなどを中心に「女児が暴行された」といううわさが広まっていました。この件について受けた取材記事が公開されましたので、お知らせします。

 籏智 広太 「『女児が性的暴行を受け子宮全摘 』 はなぜ拡散したのか 噂の専門家が語る”善意”の恐ろしさ」『BuzzFeed News』2019/3/21

 この件については、同じ記者が「『女児が公園のトイレで暴行を受け子宮全摘 ネットで拡散、過去にも同様の噂が」『BuzzFeed News』2019/3/6 という検証記事を発表しており、以前、「『10万人の宮崎勤』はあったのか?」で取材を受けたdragonerさんも、2019/3/8付で「『女児暴行のうわさ』の過去と今」を公開しています。また、毎日新聞のウェブ版(有料記事)「『花粉1万7000倍 』 『 キラキラネーム名簿 』 真偽は? ネット 拡散のワケ」2019/3/20も後半部分でこのうわさについて取り上げています。
 
 「善意のうわさ」の怖さはもちろんですが、今回のケースで一番伝えたかったのが、下記の部分。取り上げてくださった籏智さんに感謝しています。

「一方で、発信者へのバッシングが強まっていることも気になります。ルートが可視化されることで、発信者があたかも悪意を持っているかのように叩かれる。しかし、噂はデマやフェイクニュースと違って、流している側は不安や、善意をもとにしていることが多い。指摘する側も、寛容になるべきだと思います」
 
 さて、情コミ2年次必修の「メディア・コミュニケーション学」では、このようなうわさについても取り上げています。リアクションぺーパーからは、履修する学生のみなさんの考える「ネット時代のうわさ」の特徴がうかがえて、とても参考になるんですよ。

豊かな自治体ほど図書館が利用されている?その2

先日の投稿(1月22日「豊かな自治体ほど図書館が利用されている?」)について、コメントを頂いたそうです。「都心部にある図書館は、通勤などで利用する人が多いから、貸出数が多くなるのでは?」ということでした。(反響を頂けるとは思わなかったので感激です。ありがとうございます!)もっと早くに書きたかったのですが、続きのご報告が遅くなって申し訳ありません。以下、少し長くなって恐縮ですが、補足させてください。

ご指摘の件ですが、はい、その可能性はあると思います。貸出密度とは、貸出数/その自治体の人口、なので、厳密に言えば、その自治体の住民が借りているとは限りません。

そこで、東京都公立図書館データをもう一度見て、「(個人利用の)自治体内貸出比率」を出してみました。(貸出冊数内訳うち自治体内貸出数を個人貸出総数で割ってみました。)この「自治体内貸出比率」と「貸出密度」との相関係数を出すとr=-0.670。強い相関関係がみられました。「他自治体からの利用率が高い図書館ほど貸出密度の数字が高くなる」という事実は重要だと思います。貸出密度を指標とした分析の限界が示唆されますね。これも、別解釈をご指摘いただいたおかげです!どうもありがとうございます。

興味深い結果が得られたのですが、1つだけ注意も必要です。「自治体内貸出数」はデータに欠損が多く(=統計を取っていない自治体も多く)、都内自治体総数58のうち、37の自治体しかデータがそろわないのです。つまり、r=-.670という相関係数は、データの一部で見られた関係であって、すべてのデータがそろった時にどうなるのかはわかりません。 なお、こうした「データの欠損」は、データ分析ではよく見られます。たとえば世論調査の回収率は良くて60~70%です。「わからない」という回答もよくあります。利用できるデータが限られるときは、欠損を補うような補正をかけることもありますが、全体を推測するときには注意が必要です。 今回についていえば、利用者アンケートなどを併用するのが望ましいかもしれませんね。

さて、こうして、別解釈の可能性を考えるということは、データ分析において常に重要な課題です。そして一番面白いところです。 こうしたコメントを頂けて光栄です。

今回の分析例でいえば、「一人当たり税額」と「貸出密度」に相関がみられたとしても、別の変数(自治体の図書館予算や産業、利用者の年齢・学歴・職業など)を介した「疑似相関(見せかけの相関)」ではないかということはつねに頭に入れて考察する必要があります。複数の変数の効果を同時に検討する際には、 重回帰分析などの多変量解析を用いるのが1つの対策ですが、それで完了ではありません。データ分析の結果はあくまでも、「なぜそのような関係が出てくるのか」を考える次の出発点になります。(え?それじゃ意味がない?いえいえ、このサイクルが重要なのです。)

もう1つ大事なことがあります。比例や反比例などの共変関係が認められても、因果関係があるとは限りません。(税金をたくさん納めれば本を借りるというわけではありません。)因果の推測は難しいので、厳密にはランダムアサインメントを用いた「実験(対照実験)」が必要になります。(A/Bテストと呼ばれることもあります。)

ちなみに、社会情報学専攻では、隔年ではありますが「実験計画法」の授業も受講できます。簡単な心理学の実験なども体験できる授業です(私の担当ではありませんが、カリキュラムのひそかな自慢です)。ここでご紹介した研究法について 関心のある方は、安藤清志・村田光二・沼崎誠 (編)(2017)『社会心理学研究入門 補訂新版』(東京大学出版会)をぜひご一読ください。 私も第10章を担当しています。

なお、こうしたトレーニングは、学部の授業でも行っています。その一部はまた後日ご紹介させてください。

簡単な分析ができるだけで、他にもいろいろなことが見えてきます。長くなってしまったので、次回に続きます。

八王子市との共同研究・中間報告会’19

今年も八王子市との共同研究、中間報告会が行われました。そのときの様子が広報部からニュースとして配信されましたので、そちらを紹介します(手抜きですみません)

http://www.chuo-u.ac.jp/usr/news/2019/02/79494/

話題の可視化(2)

以前、「話題の可視化」というタイトルで、Twitterのトレンドワードをグラフにするという話を紹介しました。今回は、毎日たくさん現れては消えるトレンドワードそのものを図示することで、その日とくに話題に上っていたトピックは何かをひと目でわかるようにしようという試みです。

1月26日のトレンドワードマップ

この図は、2019年1月26日に収集したTwitterのトレンドワード群を、ある法則に従ってグラフ化したものです。個々のトレンドワードには「話題の可視化」で紹介したグラフが紐付けられているので、そこに出てくるワードとその出現確率で多次元空間を作ることができます。その空間においてコサイン類似度(多次元空間における類似度指標のひとつ)を計算し、一定のしきい値を超えたワード、すなわち似たような内容の話をしているもの同士を線でつないでいます。線の上に記されている数字は、コサイン類似度の値です。1.0に近いほど、両端のワードは似ている、ということになります。また、2つ以上のトレンドワードが関連するものとして判定された場合については、それぞれに色を付けて目立たせるようにしてあります。

この日は全豪オープンで大坂なおみ選手が優勝したという出来事がありました。この図でみると、中心部分の水色で示された話題がそれに関連したトピックだということが分かります。この日、いちばん大きな話題だったということも分かりますね。

1月27日のトレンドマップ

次の図は、翌日、1月27日の図です。この日は「人気グループの嵐が2020年をもって活動停止する」というスクープが話題になりました。中心部分の塊は、その話題に関連したものだということが分かります。

このように、Twitterのデータから世間の流行をひと目で分かるようにするという試み、なかなか面白いものだと思いませんか?社会情報学専攻では、こんな研究も行っています。

豊かな自治体ほど図書館が利用されている?

大学院の授業で、公開されているデータや統計資料を使って、いろいろな分析をしています。

試しに、都内23区+市町村の図書館利用(貸出密度=図書館の貸出数を自治体内人口で割ったもの)と、一人当たり税額をプロットしたら、上の図のようになりました。「一人当たりの所得が大きい自治体ほど、図書館の本がよく借りられている」という関係が見えます。

面白かったので、これを学部1年生や2年生のクラスに見せて、「なんでこんな関係になると思いますか?」と考えてもらいました。(仮説を考える練習です。)

比例・反比例関係の強さを表す「相関係数」を出してみると、一人当たり税額と貸出密度の相関係数rは0.496でした。(ちなみに分布に合わせて税額の対数をとったものと貸出密度との相関を見るとr=0.590になります。)相関係数は絶対値が1に近いほど完全な比例・反比例の関係なので、0.5前後というのは、わりと関連が強いといえる数値です。

「お金のあるところは図書館に本がたくさんある?」・・・実は蔵書数と貸出密度はやや相関がありますが(r=.375)、蔵書数と一人当たり税額はほとんど相関がありません(r=.129)。ちなみに自治体の蔵書数と関係が強いのは自治体の人口でした(r=.902)。

 「お金持ちはケチで本を買わない?」

 「お金持ちは教養がある?」

 「学歴の高い人が高所得になりがちだから?」 ・・・などなど、どれも一理ありそうです。

 個人の読書行動との関連を見てみるとさらに面白そうですね。

ゲストトーク

12月のご報告です。

1年生の授業で、ジョージア州立大学(アメリカ)の政治学教授、Sean Richeyさんに、アメリカの選挙についてゲストトークをしてもらいました。 アメリカの大統領選の仕組み、選挙区の区割りのことなど、わかりやすく説明していただきました。英語でしたが、出席者から質問も出て、よい経験になったようです。

Richey先生、ありがとうございました!

SNSは「うわさ」をどう変えたのか?

インタビュー記事です。
恩師の廣井先生の本が目立つ形で写り込む仕上がりになっていて嬉しく思っています。

「SNSは『うわさ』をどう変えたのか?」ソニーWEBマガジン「B」Chamber30 2019.1.18 

話題の可視化

2018年度後期の大学院ゼミでは「Twitterのトレンドを可視化するアプリを作成してみよう」ということになり、半年かけてなんとか面白いアプリを作ることができました。

トレンドのトピックを共起ネットワーク図で可視化

この図は、完成したアプリのスクリーンショットを並べてみたものです。トピックに関連したツイートを収集、その内容から固有名詞を抽出し、同じツイートに含まれているかどうかでその関連性(共起性)を計算、結果をネットワーク図で示しています。

大きい丸、暖色系で表されている丸で示されている単語は、よく使われている言葉です。赤い線で結ばれた2つの単語は、それぞれが同じツイートに含まれていることを表します。太い線であるほど、その頻度が多いということを表しています。

このアプリで表現された図(「共起ネットワーク図」あるいは「共起ネットワークグラフ」といいます)をみると、トピックによってツイートにいくつかのパターンがあることがわかります。もう少し調べてみると、面白い傾向が見出されるかもしれません。来年の卒業研究で、誰か、挑戦してみてくれないかなあ。

アプリは http://iiojun.xyz/twt/ でアクセスできます。興味がある人はぜひ、遊んでみてください。

第27回中央大学学術シンポジウム

第27回中央大学学術シンポジウム「地球社会の複合的諸問題への応答」が2018年
12月8日(土)に中央大学駿河台記念館で開催されました。社会情報学専攻から
は、2人の教員がそれぞれ次の報告を行いました。
安野智子「情報の読み飛ばしと世論調査の提示が情報探索と争点知識に及ぼす影
響」
宮野勝「政治家信頼・不信理由の探索」
ご来場くださったみなさま、ありがとうございました。
シンポジウムの詳細は下記をご覧ください。 第27回中央大学学術シンポジウム



1892年の中央大学

1892年の私立法律学校と講師の方々のお住まいの地図です。
中央図書館に掲示されていたものが興味深かったため、ウェブ掲載の許可をいただきました。
大体の場所は知っていましたが、地図だとわかりやすい!
この地図片手に歩いてみましょうか…

「神田区の私立法律学校と区内在住の講師 【1892(明治25)年当時)】)」

(法律学校研究会制作)