目指せ1級!30代サラリーマンボルダリング日記

都内IT企業で働く30代サラリーマンのクライミング記録

2009年12月

ちょっと調べることがあったので、メモとして残しておきます。

日本語のtweetの抽出方法はいろいろあるとおもうんだけど、
今回はフォロワー取得APIでユーザの最新のステータスが取れることから、
特定の有名人のフォロワーのtweetを集めて平均値を出してみようかと。

たぶん統計学的にどのくらいのtweetの平均値をとれば統計として信用できる値とかってあるはずよね。。
習ったような習わなかったような気がするけど、とりあえず適当な数とってみました。

ターゲットとした有名人は勝間さん。
勝間さんのフォロワーをAPIで取得して平均値をだしました。

ちょっと古いAPIの仕様見てたらpage=1とかでページ数指定するって書いてたんだけど、公式のドキュメント見たらcursorになってた。
無駄にハマった。

初期値はcursor=-1を設定して、レスポンスにnext_cursorが返ってくるので次のページを見るときはその値を設定する。
(要するにcursor=1,2,3とかじゃないみたい。)

下に書いてある簡単なバッチ作ってみたところ、
対象Tweet6587tweet
トータル文字数234153文字
平均Tweet文字数35.5文字
以上のような結果に。
*)RTで始まってるtweetは除きました。

何度かやってみてもだいたい30文字台だったので、
日本人は30〜40文字でつぶやいているんでしょう、たぶん。

tweetLength.php

<?php
$username = "USERNAME";
$password = "PASSWORD";
$target = 'kazuyo_k';

$tweet=0;
$length=0;
$cursor = -1;
for ($i=0;$i<150;$i++) {
  if ($cursor == 0) break 1;

  $url = sprintf("http://twitter.com/statuses/followers.json?cursor=%d&screen_name=%s",$cursor,$target);
  $json = request($url,$username,$password);
  if (!is_array($json->users)) continue 1;
  foreach ($json->users as $key => $val) {
    if(isset($val->status)) {
      //RTで始まるtweetは飛ばす
      if(preg_match("/^RT(.+)/",$val->status->text)) continue 1;

      if (mb_detect_encoding($val->status->text) != 'UTF-8') continue 1;
      $tweet++;
      $length+=mb_strlen($val->status->text, 'utf-8');
    }
  }
  $cursor = $json->next_cursor;
}
echo "tweet  : " . $tweet . "\n";
echo "length : " . $length . "\n";
echo "avg    : " . $length / $tweet . "\n";

function request($host='',$username='',$password=''){
  $ch = curl_init();
  curl_setopt($ch, CURLOPT_URL, $host);
  curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
  curl_setopt($ch, CURLOPT_USERPWD, "$username:$password");
  curl_setopt($ch, CURLOPT_HTTP_VERSION, CURL_HTTP_VERSION_1_1);
  $result = curl_exec($ch);
  curl_close($ch);

  return json_decode($result);
}
?>
    このエントリーをはてなブックマークに追加



P1000256


ちょうど引越しの時に読まなくなった本を売ろうと思ってたので、
ついでに手順をnanapiに書きました。
写真は自分で引越しの時に撮ったものです。

1回も読んでない本もあったので、来年は読む分だけ買うようにします。。

トータル1万円弱になったので、いらないもの売った割にはいいお値段でした。
    このエントリーをはてなブックマークに追加

いよいよ明日引っ越し。
部屋の中がカオス。
引越し準備


本を片付けてたらリサイクルに売るようの本が3箱できました。


けっこう気に入ってたこの部屋とも今日でお別れです。
引っ越し前夜



あ、準備しなきゃ・・・。
    このエントリーをはてなブックマークに追加

最近何もしない休日とかは、夜ご飯までにお腹空くように散歩にでかけます。

この前は東京タワーまで。片道20分ほど。
東京タワーのお土産買って帰ってきました。



先週は六本木ヒルズまで。
途中、十番の商店街で寄り道してたので1時間弱かけて到着。



でも散歩したらいい感じにお腹空いて食べ過ぎちゃうんだよね。。
    このエントリーをはてなブックマークに追加

このページのトップヘ