どうでもしか勝たん

格が違うので卍卍卍

Netflixから字幕を取得して見やすく整形するtips(おまけ:ドラマ"Suits"の英語字幕)

英語の勉強って大変ですよねー

個人的な意見ですけど、「勉強法」ってそんなに重要ではないような気がします。

オンライン英会話をやってみるとか、洋画を見てみるとか、資格勉強をするとか、、

人によってハマるものは違うと思うし、自分に合っているものを選べばいいと思います。

その上で一番大事なことは勉強法ではなくモチベーションでしょう。

努力せど向上しない自分の英語力に絶望しながらも、毎日同じようなことをコツコツ継続すること、これに尽きます。

 

前置きが長くなりました。前置きというか愚痴と戒めのキメラみたいなもんです、見苦しくて申し訳ありません。

今回は英語学習の効率化を目指して、動画サイトNetflixから英語字幕を取得して、それを整形することでオフラインでスクリプトを読めるようにするという記事でございます。

やることとしては大きく分けて2つ。それぞれリンクとして飛べるようになっています。

ではやってみましょう。

1.subadubを使って字幕を.srtファイルとしてダウンロード

subadubというのはGoogle Chrome拡張機能です。

国語学習の補助を目的として作られたもので、字幕のダウンロード以外にも、多言語同時での字幕表示などもできるようにしてくれます。

chrome.google.com

f:id:ii_da_ba_shi:20190425122925p:plain

subadub

subadubを拡張機能に追加してNeflixを開いてみると、右上に字幕のダウンロードボタンが出てきます。

簡単です。押すだけです。

 

しかし、ここでダウンロードされるものは.srtと呼ばれるファイル形式で、そのままでは使い勝手が悪いです。具体的には何分何秒みたいな時間の情報を含んでしまっていたり、余計な番号が振られたりしています。

f:id:ii_da_ba_shi:20190425123408p:plain

before

無理やりWordで開いてみるとこんな感じになります。

2.余計な情報を削除し、.txtとして抽出

このままでも使えないことはないんですけど、ちょっと整形してあげましょう。

Pythonでファイル読み込みをして、余計な部分をカットしていく方法です。

Gistにいい感じのソースコードがあったので拝借しました。

Simple Python Script for Extracting Text from an S ...

コマンドライン引数でargs[1]にファイル名を、args[2]にファイルのエンコードを渡すのですが、自分自身でやってみたところ、'utf-8'で大丈夫な感じがしました。

f:id:ii_da_ba_shi:20190425124923p:plain

after

Wordで開いてみるとこんな感じです。無駄な情報が減って一覧性が上がりました。

この手法で生成したSuitsの英語字幕を以下に掲載しておきます。(1話と2話だけは英語字幕が選択出来なかったため、3話以降しかありません。ご了承ください。)

Dropbox - Suits - Simplify your life

それでは良い英語学習ライフを〜〜〜