RとRStudio入門


図の1

RStudioのレイアウト

図の2

RStudioで.Rファイルを開いたレイアウト

RStudio を使ったプロジェクト管理


図の1

悪いプロジェクト構成を示すファイルマネージャーのスクリーンショット

ヘルプの利用


データ構造


データフレームの操作


データの部分集合化


図の1

不等式テスト

図の2

リサイクルによる不等式テストの結果

制御フロー


ggplot2 を使用した出版品質のグラフィック作成


図の1

何も描画されていない、ggplot() に美的マッピングを追加する前の空のプロット。

図の2

X軸に gdpPercap、Y軸に lifeExp を表示する散布図のための軸だけがあるプロットエリア。

図の3

GDP と平均寿命の関係を示す散布図。データポイントが描画されている。

図の4

平均寿命が時間とともに増加していることを示す、年と平均寿命の散布図。
平均寿命が時間とともに増加していることを示す、年と平均寿命の散布図。

図の5


図の6

GDPと平均寿命の散布図で、変数間の関係を示すトレンドラインを追加したグラフ。データポイントが拡大され、オレンジ色で、透過性なしで表示されています。

図の7


図の8

X軸が対数スケールでデータが拡散したGDPと平均寿命の散布図
X軸が対数スケールでデータが拡散したGDPと平均寿命の散布図

図の9

GDPと平均寿命の散布図に、変数間の関係を要約する青いトレンドラインが追加されたグラフ。グレーの影は95%の信頼区間を示します。

図の10

GDPと平均寿命の散布図に、少し太めの青いトレンドラインが追加されたグラフ。

図の11

GDPと平均寿命の散布図に、変数間の関係を要約するトレンドラインが追加されたグラフ。データポイントが拡大され、オレンジ色で、透過性なしで表示されています。

図の12


図の13


図の14


図の15


ベクトル化


図の1

中国、インド、インドネシアの人口(単位は100万人)を年に対してプロットした散布図。国はラベル付けされていません。

図の2

中国、インド、インドネシアの人口(単位は100万人)を年に対してプロットした散布図。国はラベル付けされていません。

関数の説明


データの書き出し


dplyr を使用したデータフレーム操作


図の1

データフレームの2つの列を選択する select 関数の使用を示す図

図の2

group_by 関数がデータフレームをグループ化する仕組みを示す図

図の3

group_by と summarize を組み合わせて新しい変数を作成する使用例

図の4


図の5


tidyr を使用したデータフレームの操作


図の1

データフレームの「広い」形式と「長い」形式の違いを示す図

図の2

gapminder データフレームの「広い」形式を示す図

図の3

pivot_longerがデータフレームを「広い」形式から「長い」形式に再編成する方法を示す図

knitrを使ったレポート作成


図の1

RStudioでの新しいR Markdownファイルダイアログボックスのスクリーンショット

図の2


図の3

RStudio バージョン 1.4 以降には、ビジュアルマークダウン編集モードが含まれています。
このモードでは、マークダウン表記(例: **太字**)が入力中にフォーマットされた外観(太字)に変換されます。
また、このモードには上部に基本的なフォーマットボタンを含むツールバーがあり、一般的なワープロソフトに似た操作が可能です。
ビジュアル編集モードは、R Markdown ドキュメントの右上隅にある
RStudio のビジュアル編集モードのオンオフ切り替えボタンのアイコン(コンパスのような形) ボタンを押すことでオン/オフを切り替えられます。


良いソフトウェアを書く方法