Shell と Git と R の使い方を学び、データサイエンスの基礎を身につける

千葉大学 西千葉キャンパス アカデミック・リンク・センター

2024年11月25日(月)と26日(火)

10:00 - 17:00 (JST)

インストラクター: ニッタ ジョエル, 西田 孝三

ヘルパー: 露崎 弘毅, 岡 昂輝

基本情報

The Carpentriesプロジェクトは、 インストラクター、トレーナー、メンテナンス担当者、ヘルパー、およびサポーターで構成される Software CarpentryData CarpentryLibrary Carpentry の コミュニティから成り立っており、「研究者に基本的な計算科学とデータサイエンスのスキルを教える」という使命を共有しています。

The Carpentriesについてもっと学び、関わり続けたいですか?
「Carpentries Clippings」は、The Carpentriesの隔週ニュースレターで、コミュニティのニュース、コミュニティの求人情報などを共有しています。 将来の版を受け取り、完全なアーカイブを読むには次の URL から「サインアップ」を行ってください:https://carpentries.org/newsletter/

Software Carpentryは、基本的な研究計算スキルを教えることによって、研究者がより少ない時間と苦痛で仕事を終えられるようにすることを目指しています。 この実践的なワークショップでは、プログラム設計、バージョン管理、データ管理、タスク自動化を含む基本的な概念とツールについてカバーします。 参加者は互いに助け合い、学んだことを自身の研究課題に応用することが奨励されます。

私たちが何を教え、なぜ教えるのかの詳細については、 私たちの論文「科学計算のベストプラクティス」をご覧ください。

対象: 研究者(大学院生、教員) 本ワークショップで勉強するツール(ソフト)の経験を問いません。

登録: Connpassから登録して下さい。

場所: 千葉大学 西千葉キャンパス アカデミック・リンク・センター(図書館)I棟3皆「きわみ」. OpenStreetMapGoogle Mapsで場所を確認する.

日程: 2024年11月25日(月)と26日(火). Googleカレンダーに追加.

参加条件: 参加者は、管理者権限を持つ Mac/Linux/Windows OSを搭載した ノートパソコン(タブレットや Chromebook などではなく)を持参する必要があります。 いくつかの特定のソフトウェアパッケージ( 下部の「セットアップ」以降の Bash, Git, Text Editor, R)をインストールしてください。

アクセシビリティ: 私たちは、このワークショップへのアクセシビリティを約束します。 ワークショップの主催者は次のことを確認しています:

事前に主催者に連絡することで、必要に応じて事前に資料を配布したり、 拡大印刷した配布資料を用意したりしています。 学習を容易にするためのお手伝い(例:手話通訳者や授乳施設など)が必要な場合は、 下記連絡先までご連絡ください。

連絡先: お問い合わせは joelnitta@chiba-u.jp にメールをお送りください。

役割: ワークショップでの役割(誰が何をするのか)を知るには、 ワークショップ のFAQをご参照ください。


行動規範

カーペントリーズの活動に参加するすべての人は、行動規範を遵守しなければなりません。 この文書には、必要に応じてインシデントが発生した場合の報告方法の概要も記載されています。


コラボレイティブ・ノート

このコラボレイティブ・ドキュメントを使って、 チャット、メモの作成、URLとコードの一部の共有を行います。


アンケート

ワークショップの前後に、これらのアンケートに必ずお答えください。

ワークショップ前のアンケート

ワークショップ後のアンケート


スケジュール

11月25日(月)

10:00 概要とセットアップ
10:20 シェルの使い方
11:00 リポジトリの作成
12:00 昼休み
13:00 変更内容の記録、履歴の探索
14:45 休憩
15:00 共同研究
16:00 GitHubのワークフロー
17:00 終了

11月26日(火)

10:00 git における衝突の解決
10:40 R と RStudioの入門
11:00 休憩
11:10 RStudio のプロジェクト管理
12:00 昼休み
13:00 データの構造
13:10 データフレームの内容を確認
14:00 データの部分集合化
15:00 休憩
15:10 ggplot2 を用いグラフィックスの作成
16:00 データの書き込み
17:00 終了

以上のスケージュルは目安で、実際の内容とは異なることがあります。


教材

ワークショップの教材はこちらから見られます:UnixシェルgitR


スライド

ワークショップのスライドはこちらから見られます。


セットアップ

ソフトウェア・カーペントリー のワークショップに参加するためには、 以下のソフトウェアにアクセスできる必要があります。 さらに、最新のWebブラウザが必要になります。

講師向けの参考資料として、 「構成の問題と解決策」のwikiページ上で、インストール中に発生しがちな問題のリストを管理しています。

なお、インストールの説明は現時点、英語のみとなっています(翻訳を貢献したい方は是非インストラクターまでご連絡お願いします(joelnitta@chiba-u.jp)。

Bashシェル

Bashはよく使われるシェルで、タスクをより迅速に実行する力を提供します。

  1. Git for Windowsインストーラーをダウンロードします。
  2. インストーラーを実行し、以下の手順に従います:
    1. 「次へ」を4回クリックします(以前にGitをインストールした場合は2回)。情報、場所、コンポーネント、スタートメニュースクリーンでは何も変更する必要はありません。
    2. 「Gitによって使用されるデフォルトエディタを選択する」ドロップダウンメニューから「デフォルトでNanoエディタを使用」を選択します(注:上にスクロールして見つけてください)そして「次へ」をクリックします。
    3. 「新しいリポジトリの初期ブランチ名を調整」ページで「Gitに決めさせる」を選択します。これにより、レッスンの最大の互換性が確保されます。
    4. 「コマンドラインとサードパーティソフトウェアからもGitを使用する」を選択し、「次へ」をクリックします。(これを行わないと、Git Bashが正しく動作せず、Git Bashのインストールを削除してインストーラーを再実行し、「コマンドラインとサードパーティソフトウェアからもGitを使用する」オプションを選択する必要があります。)
    5. 「バンドルされたOpenSSHを使用する」を選択します。
    6. 「ネイティブWindowsセキュアチャネルライブラリを使用する」を選択し、「次へ」をクリックします。
    7. 「Windowsスタイルでチェックアウト、Unixスタイルでコミット」を選択し、「次へ」をクリックします。
    8. 「Windowsのデフォルトコンソールウィンドウを使用する」を選択し、「次へ」をクリックします。
    9. 「デフォルト(早送りまたはマージ)」を選択し、「次へ」をクリックします。
    10. 「Git Credential Manager」を選択し、「次へ」をクリックします。
    11. 「ファイルシステムキャッシュを有効にする」を選択し、「次へ」をクリックします。
    12. 「インストール」をクリックします。
    13. 「Finish」または「次へ」をクリックします。
  3. "HOME"環境変数が設定されていない場合(またはこれが何かわからない場合):
    1. コマンドプロンプトを開きます(スタートメニューを開いてcmdと入力し、Enterを押します)
    2. コマンドプロンプトウィンドウに以下の行を正確に入力します:

      setx HOME "%USERPROFILE%"

    3. Enterを押すとSUCCESS: Specified value was saved.というメッセージが表示されます。
    4. exitと入力し、Enterを押してコマンドプロンプトを終了します。

これにより、Git Bashプログラム内でGitとBashの両方が提供されます。

ビデオチュートリアル

Mac OS X Ventura以降のデフォルトシェルはZshですが、Bashはすべてのバージョンで利用可能なので、何もインストールする必要はありません。 Bashにアクセスするには、/Applications/Utilitiesにあるターミナルを使用します。 ターミナルを開く方法については、Gitインストールビデオチュートリアルを参照してください。 このワークショップのために、ターミナルをドックに保持しておくと便利です。

デフォルトのシェルがBashかどうかを確認するには、ターミナルでecho $SHELLと入力し、Returnキーを押します。表示されたメッセージが'/bash'で終わらない場合、デフォルトは他のものです。現在のシェルをBashに変更するにはbashと入力してReturnを押します。現在のシェルを確認するにはecho $0と入力してReturnを押します。

デフォルトシェルをBashに変更するにはchsh -s /bin/bashと入力し、Returnキーを押した後、再起動して変更を適用します。デフォルトをZshに戻すにはchsh -s /bin/zshと入力し、Returnキーを押して再起動します。利用可能なシェルを確認するにはcat /etc/shellsと入力します。

ビデオチュートリアル

デフォルトのシェルは通常Bashで、通常何もインストールする必要はありません。

デフォルトのシェルがBashかどうかを確認するには、ターミナルでecho $SHELLと入力し、Returnキーを押します。表示されたメッセージが'/bash'で終わらない場合、デフォルトは他のものです。現在のシェルをBashに変更するにはbashと入力してReturnを押します。現在のシェルを確認するにはecho $0と入力してReturnを押します。

デフォルトシェルをBashに変更するにはchsh -s /bin/bashと入力し、Returnキーを押した後、再起動して変更を適用します。デフォルトをZshに戻すにはchsh -s /bin/zshと入力し、Returnキーを押して再起動します。利用可能なシェルを確認するにはcat /etc/shellsと入力します。

Git

Gitは、誰がどの部分をいつ変更したのかを追跡できるバージョン管理システムで、 github.comでコードの共有または公開バージョンを簡単に更新するためのオプションも備えています。 サポートされているウェブブラウザが必要です。

Gitのレッスンの一部では、github.comのアカウントが必要です。基本的なGitHubアカウントは無料です。 まだアカウントをお持ちでない場合は、GitHubアカウントを作成することをお勧めします。 公開する個人情報についてはよく考えてください。たとえば、 GitHubが提供するメールアドレスを非公開にする方法 を確認してみてください。

Gitは、Bashのインストールの一部としてコンピュータにインストールされるはずです( Shellインストール手順を参照してください)。

macOSの場合このリスト から最新の「mavericks」インストーラーをダウンロードして実行することでGit for Macをインストールします。 このインストーラーは開発者によって署名されていないため、.pkgファイルを右クリック(またはcontrolクリック)し、 「開く」をクリックして、ポップアップウィンドウで「開く」をクリックする必要がある場合があります。 Gitをインストールしても/Applicationsフォルダに何も表示されません。Gitはコマンドラインプログラムです。 OS Xの古いバージョン(10.5-10.8)の場合、 最新の「snow-leopard」ラベルのインストーラーを こちら からダウンロードしてください。

ビデオチュートリアル

Gitが既にマシンにインストールされていない場合、ディストリビューションのパッケージマネージャーを使用してインストールを試みることができます。 Debian/Ubuntuの場合はsudo apt-get install gitを実行し、 Fedoraの場合はsudo dnf install gitを実行します。

テキストエディタ

コードを書くときには、キーワードの自動カラーコード化など、コードの記述に最適化されたテキストエディタがあると便利です。 macOSとLinuxのデフォルトのテキストエディタは通常Vimに設定されていますが、Vimは直感的であることで有名ではありません。 もしうっかりVimに入ってしまった場合は、Escキーを押し、その後:+Q+! (コロン、小文字の 'q'、感嘆符)を押し、Returnキーを押すと、シェルに戻ることができます。

nanoは基本的なエディタで、ワークショップで講師が使用するデフォルトのエディタです。 Gitと一緒にインストールされます。

nanoは基本的なエディタで、ワークショップで講師が使用するデフォルトのエディタです。 nanoの開き方については、Gitインストールのビデオチュートリアルを参照してください。 事前にインストールされているはずです。

ビデオチュートリアル

nanoは基本的なエディタで、ワークショップで講師が使用するデフォルトのエディタです。 事前にインストールされているはずです。

R

Rは、データの探索、可視化、統計分析に特に強力なプログラミング言語です。Rと対話するには、RStudioを使用します。

この.exeファイルCRANからダウンロードして実行することでRをインストールします。 また、RStudio IDEもインストールしてください。 ユーザーアカウントと管理者アカウントが別々の場合、インストーラーを管理者として実行してください(.exeファイルを右クリックして「管理者として実行」を選択)。そうしないと、後でRパッケージのインストール時などに問題が発生する可能性があります。

ビデオチュートリアル

この.pkgファイルCRANからダウンロードして実行することでRをインストールします。 また、RStudio IDEもインストールしてください。

ビデオチュートリアル

各種Linuxプラットフォーム(Debian、Fedora、Redhat、Ubuntu)でのRインストール手順は <https://cran.r-project.org/bin/linux/>に記載されています。これには、パッケージマネージャーを使用する指示が含まれています(例:Fedoraの場合はsudo dnf install Rを実行、Debian/Ubuntuの場合はppaリポジトリを追加した後にsudo apt-get install r-baseを実行します)。 また、RStudio IDEもインストールしてください。