データサイエンティストへの道

初心者がデータサイエンティストになるまでの備忘録

環境構築に困ったとき (コンテナ仮想化)

要約

プログラミング (python, html, cssなど) を学習しようと決めた人が、最初に時間を取られるのが、環境構築です。
環境構築を簡単にしてくれるのが、コンテナという技術です。
コンテナを用いることで、何度も環境を構築したり、捨てたりすることができるからです。
よって、環境構築がうまくいかなくても最初からやり直すことができます。
今回は、コンテナの概要について、ご説明します。

背景

プログラミングを始めるときに、最初に時間を取られるのが、環境構築です。
自分も散々、時間を取られてきました。平気で1日とかかかります。
1日かけて、環境が構築できれば、まだ良い方です。
環境を構築した後に、必要なものが出てきて、それをインストールするのに、また1日かかるなんてことも。。。
これ、なぜ環境構築に時間がかかるかというと、ググっても自分の状況にぴったりな情報が出てこないからです。
これは、人それぞれPCの状況が異なるので、しょうがないことではあります。
(Windowsだったり、Macだったり、特定のソフトウェアを入れてたり、入れてなかったり)
そこで、自分の手元のPCとは、別の場所で、環境を構築することで、解決を図ります。
そのために用いるのが、コンテナという技術です。

コンテナの概要

環境構築を簡単にしてくれるのが、コンテナです。
コンテナとは、仮想化環境であり、通常の仮想マシンより軽量です。
といっても、はっきりいって意味がわかりません笑
まず、自分の使っているPCのOS (Windows, Mac, Linux, ...) の上に、仮想的に異なるいくつものOSを立てることを仮想化といいます。
手元にあるPCのOSはWindowsだけど、その中身には、MacLinuxが入っているよといったイメージです。
ここでは、ざっくりとしたイメージを掴んでいただくことが重要です。(正確な理解は必要ありません。)
従来の仮想化技術で、実現されているものを仮想マシンと呼び、下の左の図になります。
ここで、今まで手元のPCのOSと呼んでいたものを、ホストOSということにします。(Windowsの方)
中身の方のOSをゲストOSとします。(Mac, Linuxの方)
続いて、コンテナでは、仮想化の際、ゲストOSを必要としません。
これにより、従来の仮想マシンよりも、軽量なものとなります。
ここでも、ざっくりと従来のものより軽いんだくらいで、大丈夫です。 f:id:ryotaro45123:20201018124826p:plain

コンテナの利点1

コンテナの利点の1つ目は、何度も環境構築をやり直すことができることです。
これは、さきほど説明したように、コンテナが軽量だからです。
軽量なことで、高速に仮想化環境を起動、停止、削除できます。
つまり、仮想化環境上で、プログラミングの環境を構築し、失敗したら削除するということを何度も手軽にできるようになります。

コンテナの利点2

コンテナの利点の2つ目は、構築した環境をドキュメントとして保存できることです。
手順書のようなものを残しておくことで、何度も同じ環境を構築できたり、他の人が構築したものと同様のものを構築できたりします。
これをIaC (Infrastructure as Code) と呼んだりします。(環境をコードとして、明示する)
うまくいった環境構築のパターンをドキュメント化し、それを実行するだけで、同じ環境をすばやく構築することができるのが、コンテナの利点です。
これは、さきほど説明したように、コンテナが軽量だからです。
軽量なことで、高速に仮想化環境を起動、停止、削除できます。
つまり、仮想化環境上で、プログラミングの環境を構築し、失敗したら削除するということを何度も手軽にできるようになります。

まとめ

今回は、プログラミングを始める上で、最初の難関である環境構築を簡単にする方法を説明しました。
コンテナという仮想化環境を用いることで、環境構築を何度もやり直したり、ドキュメントとして保存したりします。 今後は、実際にコンテナを利用するための、dockerというソフトウェアのインストールから続けていきます。

では、また次回の記事で!

統計検定2級に合格する方法

要約

データを扱うものとして、一般的な統計学の知識は、身に付けておいて損はないです。
筆者は、統計学の勉強の指針として、統計検定2級の取得を目指しました。
勉強したことは、統計学入門 (書籍)、統計web (ウェブサイト)、確率統計 (youtube)、基本統計学 (書籍)、過去問 (書籍)の5つです。
勉強を開始してから、3週間程度で、無事に合格しました。
合格のコツは、統計検定の範囲が広いので、何度も繰り返し勉強することです。

背景

仕事でデータを扱うものとして、データの見方がわかるようになる統計学は、抑えておく必要があります。
前提として、筆者は、大学でも統計の授業を受けておらず、偏差値とか標準偏差に関して、名前だけは知っているが、使い方は知らないという状態でした。
(偏差値60がすごいのはわかるが、じゃあどれくいすごのかは、わかっていませんでした。。。)

しかし、データサイエンスを学ぶ上で、統計学は避けては通れない道だと思いましたので、基本的な統計学の勉強から開始しました。
あと、実際のデータの見方がわかるようになるのは、業務においても利点かなと。
さらに、現実の世界で、データから母集団の推定とかできたら、めっちゃいいなって思って、始めました。

統計検定2級

まず、筆者は、統計学の勉強の指針として、統計検定2級の取得を目指しました。
しかし、実際に何から勉強していいのかわからなかったので、勉強の指針として、統計検定2級の取得を目標に設定しました。 www.toukei-kentei.jp

統計検定2級の範囲は、データの見方や記述方法、推定や検定などが含まれます。
最初は、推定?検定?という感じなので、あまり気にしなくいいです。 https://www.toukei-kentei.jp/wp-content/uploads/grade2_hani_181214.pdf

勉強内容

筆者が、統計検定を受験するまでに、勉強したことは、統計学入門、統計web、確率統計、基本統計学、過去問の5つです。

  1. 統計学入門は、まず最初に読むべき本です。
    統計学とは、どんなもので、どのように使うのかが書かれています。
    何も知らない初学者でも、わかるように書いてあるので、最初に読むにはおすすめです。
    ほかにも有名なものだと、統計学がわかる (ファーストブック) なんかもあります。こちらもおすすめです。
    どちらかだけで良いと思います。 www.amazon.co.jp www.amazon.co.jp

  2. 統計webは、統計検定2級程度の知識をまとめてくれているウェブサイトです。
    このサイトに書いてあることが理解できたら、統計検定2級は合格できると思います。
    しかし、このサイトだけでは、理解が深まらず、合格できないと思います。
    統計検定2級に対して、必要な知識が網羅されているので、自分がどこがわからないのか、あと何を勉強したらいいのかが把握できて、大変便利です。 bellcurve.jp

  3. 確率統計は、ヨビノリたくみさんが解説している確率統計についてのyoutubeの動画です。
    筆者は、あまりヨビノリたくみさんの動画を見たことがなかったのですが、確率統計に関して、非常にわかりやすくまとめてありました。
    とても説明がわかりやすかったです。
    視聴者がイメージを掴みやすいように、説明してくださってて、ありがたかったです。(ポアソン分布についてなど)
    動画自体も面白いので、統計webの息抜きなどにもおすすめです。
    (相対性理論の動画とかもおもしろかったです。) www.youtube.com

  4. 基本統計学は、統計webでは、導出していない部分について、補完するための本です。
    統計webは網羅的である一方、導出などは省かれています。
    ですので、なんでその公式が出てきたの?とか、その公式のイメージが掴みづらい。。。っていう人には、基本統計学で、より詳細に説明を追うことをおすすめします。
    統計検定2級に合格するだけなら、必要ないと思います。
    また、基本統計学は、しっかり数式が出てきますので、それなりに時間がかかります。
    ですので、あくまで、知識の補完のために、必要な部分だけを読むのがいいかなと思います。 www.amazon.co.jp

  5. 過去問は、公式のもので、3年分計6回分が含まれます。
    これは、試験までの仕上げで用います。
    気をつけてほしいことなのですが、過去問を解く時間を十分に確保した方がいいです。
    試験時間が90分なのですが、時間が結構ギリギリです。 筆者は、いつも試験時間いっぱいまで、かかってました。
    なので、復習も含めて、2 ~ 3時間取れるときに、過去問を解くと良いと思います。 www.amazon.co.jp

勉強方法

統計の勉強を開始してから3週間程度で、統計検定2級に合格しました。

  1. 最初の1週間で、統計学入門を読みつつ、統計webを進めました。
    統計学入門は、読み物チックなので、統計学で何をやっているかの概要が掴めたら十分です。
    統計webは、統計検定2級に必要な知識が網羅されているので、これをみて全体感を掴みました。

  2. つぎの1週間で、統計webを進めながら、わからないことを基本統計学で、補完しました。
    統計webは、知識が網羅的に載っている分、詳細は省かれています。
    そこが気になる方は、基本統計学で、詳細に導出などを追いかけると良いです。
    統計検定に受かるだけならば、公式などを暗記してしまってもいいと思います。
    筆者は、公式の意味を掴みづらかったので、実際に導出などを追って、イメージを掴むようにしていました。(不偏分散はなぜN - 1で割るのかなど)

  3. 最後の1週間で、過去問を繰り返します。
    最初は、全然できなくて大丈夫です。筆者も全然できませんでした。。。
    まず、問題の形式と時間に慣れることが重要です。
    試験時間は、90分と長いのですが、意外と時間が足りないです。
    ここでは、本番を想定して、電卓で計算されることをおすすめします。

合格するコツ

統計検定に合格するコツは、何度も繰り返し勉強することです。
統計検定2級の範囲は広いので、一度勉強しただけで、理解するのは難しいです。
筆者も、何度完璧に理解した!と思って、実際に問題を解いて撃沈したことか。。。
ですので、書籍にしろ、過去問にしろ、何度も周回しましょう。
不思議なことに、1週目で理解できなかったことでも、2周、3周とすることで、なんとなく理解できるようになります。これは本当に不思議ですね。なんでなんですかね笑

  1. 1週目では、理解できなくていいので、頭の中にイメージを作るようにしましょう。(統計学入門、統計web)

  2. 2週目では、そのイメージを少しずつ固めていきましょう。(統計web、youtube、基本統計学)

  3. 3週目では、そのイメージを自分で説明できたり、使えたりするようにしましょう。(基本統計学、過去問)

まとめ

データを扱うときに、統計学の知識は必要不可欠です。
そこで、筆者は手始めに統計検定2級の取得を目指しました。
それに向けて勉強したことは、統計学入門 (書籍)、統計web (ウェブサイト)、確率統計 (youtube)、基本統計学 (書籍)、過去問 (書籍)の5つです。
3週間程度で、無事に合格できました。
統計検定は範囲が広いので、何度も繰り返し勉強しましょう。
引き続き、統計に関して学んだことをアウトプットしていきます。

余談

統計検定に合格したことで、なんとなく統計の知識を用いてできることのイメージは掴めました。
(特に推定や検定は、現実でも使えそう!面白そう!と思いました。)
ですが、これを現実で、解決したい問題に適用することが、本来の目的です。
何か得られたデータから、その母集団を推定したり、仮説検証することで、根拠のある説明をしたり。
これに関して、筆者もまだまだ未熟者ですので、引き続き勉強を継続していきます。

では、また次回の記事で!

AWS認定クラウドプラクティショナー に合格する方法

要約

現代のIT技術として、クラウドサービスの知識は必要不可欠です。 例えエンジニアでないとしても、その概要は知っておいて損はないです。

クラウドについての知識を得るにあたって、まずAWSの一番簡単な資格であるクラウドラクティショナー の取得を目指すのが良いです。
筆者が合格するまでに、勉強したことは、参考書とudemyの講座のみです。
また、勉強を開始してから、2週間程度で合格できました。

aws.amazon.com

背景

現代において、クラウドサービスの知識は必要不可欠です。
変化の早い時代において、自由にスケール (使いたいときに使えて、使わないときは料金がかからない) させることのできるクラウドサービスは、非常に便利です。
クラウドと聞くと、icloudgoogle driveのようなデータを保存するクラウドストレージサービスをイメージされる方が多いかもしれません。
しかし、クラウドサービスには、他にも、仮想サーバやデータベース、DNS (ドメインネームサービス) などがあります。
これらを詳細に知る必要はないですが、どんなことができるのか、概要を知ることは大切です。

おすすめ理由

その知識習得の足掛かりとして、AWS認定クラウドラクティショナー の取得を目指すことおすすめします。
AWSクラウドサービスの中でも、最大手です。
よって、AWSを中心にクラウドを勉強するのが手っ取り早いです。
AWSの認定資格は、種類がたくさんあります。
しかし、その中でも、一番簡単で、広く浅く知識をつけることができるクラウドラクティショナー がおすすめです。

勉強方法

この資格の取得のために、筆者がやったことは、参考書とudemyの講座です。
以下に示す参考書とudemyの講座を2つ勉強しました。
資格取得だけが目当ての場合は、udemyの講座は問題集のものだけで十分です。
実際にAWSを使う予定のある人は、是非ハンズオンの講座も実施されることをおすすめします。
自分で手を動かすことで、各サービスのイメージがつかめるので、理解が進みやすくなります。

参考書 www.amazon.co.jp

問題集 www.udemy.com

ハンズオン www.udemy.com

勉強期間

実際に取得するまでにかかった期間は、2週間程度でした。
最初の1週間で、ハンズオン講座を修了し、残りの1週間で、参考書と問題集をこなしました。
この問題集は、実際の試験よりも難しく作ってあるので、問題集を中心に進めつつ、参考書で補完するのがいいです。
筆者は、演習テスト5までを、解けるようになるまで、何度も繰り返しました。

まとめ

クラウドサービス、特にAWSに関する知識は、技術系、通信系の方には、必須の知識です。
知識習得の一歩目として、AWS認定クラウドラクティショナーの取得を勧めます。
筆者は、紹介した参考書とudemyの講座で、学習しました。
また、2週間程度の期間で、資格を取得できました。

では、また次回の記事で!

.com Master ADVANCE ダブルスターに合格する方法

要約

これから.com Master ADVANCEダブルスターを受験される方の参考になればと思い、筆者が合格するまでに、勉強したことを紹介します。
この資格に合格するために、最も効果的なことは、試験を申し込むことです。
具体的な勉強方法としては、以下で紹介する参考書をやりこむだけです。
また、勉強期間は、3週間程度で、870点を取れました。
さらに、この資格を取得することで、AWSなどのクラウドサービスへの理解が深まります。

www.ntt.com

はじめに

これから受験される方に向けて、合格するコツ、勉強内容、勉強期間、勉強する利点の4つを紹介します。
この資格は、会社の指定資格だったり、奨励金の対象になることが多いです。
なので、そのために合格を目指す人は多いのではないでしょうか。
しかし、勉強するモチベーションが続かないという人も多いと思います。
そういった人に向けて、何をしたらいいのか、どれくらい勉強すればいいのかについて、紹介したいと思います。

合格するコツ

はじめに、この資格に合格するコツは、試験を申し込むことです。
コツというより必要条件かもしれません。 これは、断言できるのですが、この手の試験 (ベンダー試験) は、ゴールを決めないと、モチベーションが続かないです。
また、試験日が迫ってくる焦りが、勉強への集中力を高めてくれます。

勉強方法

つぎに、筆者が合格するまでの勉強方法は、これから紹介する参考書をやりこむだけです。
結構ページ数があるのですが、練習問題もついているので、本当にこれ1冊で、合格できます。

www.amazon.co.jp

勉強前の筆者の知識レベルとしては、TCPやIPなどの単語は聞いたことがあるが、理解はしていないという状態でした。
そこで、とりあえず、参考書の練習問題以外の部分を読了しました。
このとき、読んだ部分を自分の言葉で、まとめ直しました。
ダブルスターの分野も読みましたが、ほとんど理解できなくて大丈夫です。
筆者もほとんど理解できなかったです。

つぎに、練習問題を重点的に進めました。
練習問題に取り組み、理解が浅いところや、ダブルスターの範囲を復習しました。
これを3回繰り返すことで、練習問題について、ほとんど解けるようになりました。
このとき、問題自体を覚えてしまう危険性もあるので、本当に理解できているのかの確認は必要です。

勉強期間

また、合格するまでの勉強期間は、3週間程度です。
勉強を開始した日 (試験を申し込んだ日) から、最低1日2時間は、勉強時間を確保することに努めました。(確保できなかった日もあります。。。)
ここで、まとめて2時間取ろうとするとしんどいので、朝と夜に1時間ずつ分割して、時間を確保しました。
また、気合を入れすぎると、途中でバテると思うので、気楽に勉強に臨みました笑

平日は、朝と夜の2時間を確保しました。休日は、家に籠もって、だらだらと4時間くらいは確保しました。
このとき、勉強する時間は決めた方がいいと思います。
筆者の場合は、平日の朝7:00 ~ 8:00と夜20:00~21:00は勉強時間と決めていました。
逆に、この時間以外は、勉強しないと決めていました。

勉強する利点

この資格の勉強を通じて、ネットワークやインフラストラクチャに詳しくなることは、AWSなどのクラウドサービスを利用するときに役立ちます。
この資格自体が、本質的に役に立つ人は、あまり多くないのかなと思います。
しかし、ここで学んだ知識を活かして、別の勉強への基礎固めにはなります。
筆者の場合は、業務で用いるAWSのサービスを利用するときに、役立ちました。
この資格を取った後に、AWS認定クラウドラクティショナー も取得しました。
これについては、また別の記事にしようと思います。

aws.amazon.com

結論

このように、ほとんど知識のない状態からでも、上記の参考書を3週間しっかりと勉強するだけで、合格できます。
さらに、クラウドサービスを使う上での基礎固めにもなります。

では、また次回の記事で!!

自己紹介とブログを始めた目的

はじめに

はじめまして!りょーたろーといいます。 初心者ながら、はてなブログを始めてみました。 ブログを書いた経験がなく、緊張しますが、これからよろしくお願いします!

初回は、自己紹介とブログを始めた目的について、述べていきます。

自己紹介

私の属性としては、以下の3つがあります。

  • 社会人1年目
  • 修士
  • データ分析職

では、それぞれについて説明します。

1つ目、今年の4月から、通信事業者で社会人をスタートした新卒1年目です! 緊張の社会人デビューでしたが、コロナ騒動で、研修などがすべてオンラインで行われ、いまだ実感が湧かないのが正直なところです。

2つ目、最終学歴は、大学院の工学修士卒です。なので、現在24才となります。 大学院では、半導体のレーザを研究していました。

3つ目、仕事としては、データ分析を主に行っております。 大学院の研究とは、ほとんど関係のない仕事に就くことになりました。通称、データサイエンティストと呼ばれる職種です。

ブログを始めた目的

ブログを始めた目的は、以下の2つです。

  • 学習のアウトプット
  • 文章の書き方の練習

では、以上2つについて説明します。

まず、日々の学習のアウトプットの場として、このブログを活用しようと思っております。 データを扱う業務に携わっており、データの活用についての学習を続けています。 しかし、インプットが多くなりがちなので、知識の整理の場として活用したいと考えてます。

あとは、論理的な文章の書き方の練習の場としても、活用しようと考えております。 いわゆるロジカルシンキング、ロジカルライティングの練習として、実際に文章を書こうと思っています。

まとめ

今回のブログでは、自己紹介とブログを始めた目的について述べました。 社会人1年目として、日々の学習のアウトプットと論理的な文章作成の練習として、ブログを活用していきたいと思います。

では、また次回の記事で!