R for Reproducible Scientific Analysis

ブログラマーでない人のための gapminder データを用いた R 入門。

この講座の目的は、プログラミング初心者に R を使ったデータ解析のためのモジュール化されたコードの書き方と、 そのベストプラクティスを教えることです。R は多くの科学分野の統計分析や サードパーティーパッケージによる様々なデータ解析に使用されています。 私たちは、ソフトウェアカーペントリーワークショップに参加した多くの科学者が、R を使用し、 もっと学びたいと思っていると理解しています。この教材は、参加者に R の基本中の基本を 理解してもらうこと、解析をモジュラーユニットに分割することやタスクの自動化、 およびカプセル化など、科学的コンピューティングのベストプラクティスを教えることに主眼をおいています。

このワークショップは、プログラミング言語 R の基礎を教えることが目的であり、 統計分析を教えることは含まれていないことに注意してください。

レッスンには、1日に教えることができる以上の素材が含まれています。 講師ノートのページには、 1日または1日半のワークショップに適したレッスンプランがいくつかあります。

このワークショップでは、さまざまなサードパーティパッケージが使用されています。 これらは必ずしも最高だからという理由ではなく、汎用的という訳でもありませんが、有用であり、 主に使いやすさという観点から選ばれたパッケージです。

予備知識

コンピュータがデータと命令(プログラムやスクリプト等)をファイルに保存することを理解していること。 ファイルはディレクトリ(フォルダ)によって構成されていることを理解していること。 パスを指定することによって、作業ディレクトリにないファイルにアクセスする方法を理解していること。

計画

セットアップ レッスンの必要なファイルをダウンロードします
00:00 1. R と RStudioの入門 RStudio はどのように操作したらよいですか?
R とはどのようにやりとりしたらよいですか?
環境の管理はどうしたらよいですか?
パッケージのインストールはどうしたらよいですか?
00:55 2. RStudio のプロジェクト管理 R のプロジェクトの管理はどうしたら良いですか?
01:25 3. ヘルプ機能 R のヘルプ機能はありますか?
01:45 4. データの構造 Rにデータをどう読み込ませばいいですか?
R の基本的なデータタイプにはどのようなものがありますか?
R のカテゴリー情報はどのように表現しますか ?
02:40 5. データフレームの内容を確認 データフレームはどのように操作すればよいですか?
03:10 6. データの部分集合化 データの部分集合化を R で行うにはどのようにすればいいですか?
04:00 7. 実行の制御 R でデータに依存した選択を行うにはどうすればよいですか?
R で処理を繰り返すにはどうすればよいですか?
05:05 8. ggplot2 を用いたパブリッシュ出来る品質のグラフィックスの作成 R でパブリッシュ出来る品質のグラフィックを作成するにはどうすればよいですか?
06:25 9. ベクトル化 ベクトルの全要素はどうしたら一括で操作出来ますか?
06:50 10. 関数について R で関数はどのように書きますか?
07:50 11. データの書き込み R で作成したプロットやデータを保存するにはどうすればよいですか?
08:10 12. plyr によるデータフレームの分離と併合 異なるデータセットに異なる計算を施すにはどうすればよいですか?
09:10 13. dplyrによるデータフレームの操作 同じ作業を繰り返すことなく、データフレームを操作するにはどうすればよいです?
10:05 14. tidyr によるデータフレームの操作 データフレームのフォーマットを変更するにはどのようにすればよいですか?
10:50 15. knitr によるレポートの作成 ソフトウェアとレポートはどのように統合すればよいですか?
12:05 16. 良いソフトウェアの作成 他の人も使えるソフトウェアを書くにはどうしたらよいですか?
12:20 終わり

実際のスケジュールは、インストラクターが選択したトピックや演習によって若干異なる場合があります.