integerのブログ

2015年5月10日日曜日

2015年4月9日木曜日

Rのデータセットのサンプルコードを集める

Rには多くのデータセットがあり、それらを用いたサンプルコードがある。たとえば、example(Titanic)で、データセットTitanicのサンプルコードが実行されて、モザイクプロットが表示される。
サンプルコードは大変参考になるので、そのコードのみを集めるコード。

2015年1月1日木曜日

RStudio+Sweave+日本語

　あけましておめでとうございます。
　ＲＳｔｕｄｉｏのＳｗｅａｖｅで日本語が通るようにした。参考にしたのはteramonagiさんのブログ。
　使用しているＴｅＸはＴｅＸＷｏｒｋｓをインストールしたときに一緒に入ったｗ３２tex。

ae.sty と Sweave.styをSweaveソース(.Rnwファイル）を置くところに置く。
RStudioのSweaveのデフォルト設定ではPdfLaTeXとなっているのを、LuaLaTexに変更するために、RStudioのconsoleで、次を実行。
Sys.setenv(RSTUDIO_PDFLATEX="C:\\w32tex\\bin\\lualatex.exe")
RStudioのメインメニューから「File→New File→R Sweave」で新規作成したら、次の１行を追加。
\usepackage{luatexja}

2014年12月28日日曜日

　２０１４年１１月３０日統計検定１級を受験した。てっきり落ちたと思っていたのだが、どうも合格したらしい。ＷＥＢ発表に私の受験番号があった。合格者数３８名。さらにその上、成績優秀者らしい。Ｓが６名、Ａが６名。私はＡの方だ。
　数理統計の１番は条件付き確率であった。[１]の最初の問題は解けたが、次の問題がわからなかった。帰ってから考えるに、積分すればよいらしい。それがわかれば、[２]以降はどうということはない問題だった。ここで時間を使った。数理統計２は[１][２]は解けたが、[３]の独立の証明からできなかった。数理統計はこれ以上手を付けてない。統計応用は人文分野を選択した。もっとしっかりした分野を選択したかったが、それほど実力はないし、私の仕事柄試験の分析とか考えるとこの分野で妥協した。これは大方３問解けたと思う。もっとも最後の１問は途中で終了の合図があったために書きかけである。
　このようなざまであったので、当然落ちたものと思っていた。そういえば、３０年以上前、大学を受験した時も１番のやさしいところができなくて、落ちたと思っていたら受かっていた。
　去年の１１月ころから本格的に統計の勉強を始めた。直前のブログの２月１日に断片がある。このころは東京大学出版の「統計学入門」を勉強していた。そのあと、「自然科学の統計学」やホーエルの「入門数理統計学」などを相手に悪戦苦闘した１年間であった。

2014年2月1日土曜日

離散的な確率分布をする確率変数の定義に基づいた生成

２項分布は高校でも扱うので、いくらかイメージを持っている。それ以外の超幾何分布やら何やら読んだだけで分かったつもりになっていたが、問題を解こうとすると理解できていないことに気づく。理解の助けになるだろうかと思い、Ｒで、定義に基づいて確率変数を生成してみた。

2013年8月25日日曜日

python

　しばらくほったらかしであったpythonを少しは使えるようにしたいと思い、「はじめてのPython3」をまじめに勉強しようと思い立った。章末問題をこつこつ解き、第５章まではひと通りやった。だいぶ復習になった。第６章のクラスに関する問題は１番までやった。勉強になった。ソースを読むということがいかに大切かわかった。
　第９章に、特定のホームページの画像ファイルをダウンロードするというサンプルがある。これを参考に、リンクのURLを渡り歩くプログラムを作ろうと考えた。この本ではurllibとreを使って、リンクや画像ファイル名を正規表現で切り出す。しかしなかなかリンクを取り出す正規表現は難しく、結局HTMLParserを使うこととした。ここに行きつくまでにも紆余曲折があった。Beautiful Soupがよいとかrequestsがよいという記事を何回も目にし、インストールも何回か試みたがうまくいかなかった。おかげでHTMLParserを調べざるを得なくなったのだが、これは良い勉強であった。
　HTMLParserはその名の通りhtmlファイルを読んで、タグを解析して、返すのだが、その返し方が秀逸である。ほう、こういうふうにやるのか、と感心しきりである。
　その方法とはこうである。まず、HTMLParserのサブクラスをつくる。サブクラスからHTMLParser.feed(data)でHTMLファイルを流し込んでやると、HTMLParserは、解析してタグに出会うとHTMLParserのメソッドhandle_starttag(tag,attrs)を呼び出すのである。この時、であったタグと付随する情報がtagとattrsで渡されるのである。しかし、HTMLParserのメソッドhandle_starttagはとくにどうという行動はしない。で、作ったサブクラスにおなじ handle_starttagというメソッドを定義する。すると、これが呼ばれる。なので、やりたいことは、ここで定義するのだ。
　HTMLParserのソースを眺めてみると、正規表現が数多く使われている。こりゃ自分じゃ作れないわけだと思った。
　Pyscripterの使い方もだいぶ学習した。前々から素晴らしいと思っていたが本当に素晴らしいことが分かった。
　なお、使っているのはPython Portable でPythonのバージョンは3.2.1.1である。Python自体では3.3が出ていて、結構な変更があり、日本語のドキュメントもしっかりしているので3.3に移行したいが、Portableではまだ3.3になっていないのが残念だ。
　

2013年8月15日木曜日

スロージョギング

福岡大学の田中宏暁教授の提唱するスロージョギングの動画をＹｏｕTubeで見た。やってみた。ためしてがってんでも取り上げられたらしい。やり方は、

背筋を伸ばす
やや前傾姿勢
足は押すだけ、蹴らない
ニコニコおしゃべり
きつかったら歩く

1日30分（10分×3回でもよい）が目安。
会話ができなくなる一歩手前までにする。
膝が痛い人はジョギングしない。

(hakuraido ブログより)

行きはスロージョギング約３０分、帰りはウォーキング約３０分。
２日やったが、太ももが痛い。きっと効果があるということだろう。
行き帰りスロージョギングできるようにしたい。