Amazon TranscribeアマゾントランスクライブでYouTubeの文字起こしをしてみた!

ひさびさのママハック記事です!

あーしゃんママは仕事で音声データの文字起こしをすることがあります。
これが実に大変な作業なのでございまして、5分の音源を文字起こししようと思ったらあーしゃんママは30分から1時間くらいかかってしまいます。タイピングにはそれなりに自信があるのに、それでも文字起こしというものはまた別のスキルなのでしょうね。

※ちなみにタイピング速度は、WPM(1分間に打つ文字数の平均)は長文だと300前後、腕試しだと270前後
あなたのタイピングレベルを診断「腕試しレベルチェック」

スピーカーは、アナウンサーさんみたいに綺麗にはっきり、聞き取りやすく話す人ばかりじゃないですし「あの」とか「えーと」とかフィラーが多いとそれは除去しなきゃいけなかったりね。

というわけで、今回は日本語対応したAmazon Transcribe(アマゾン トランスクライブ)を使って文字起こしをしてみました!

Amazon Transcribe:準備編

実際の使い方を順に追ってご説明します。

AWSのアカウントを作る

AWSアカウントはこちらから作成してください。ステップにしたがっていけば簡単に作ることができます。
https://aws.amazon.com/jp/register-flow/

S3に入る

「Amazon Transcribe」で使用する音声データは「S3」という場所に格納する必要があります
バケットって英語読みだけど要はバケツのことですね(日本語版ではバケツって表記すればいいのに)。

この「S3」の場所なんですが、AWSにはサービスがたくさんあるので、検索窓から探して入ってください。

通常「S3」の利用が有料になるらしいのですが(容量ごとに金額設定あり)、今なら新規登録で12ヶ月無料(ただし5GBまで。これを超えると期間内でも有料になる)です。

新しいバケットの作成

①名前とリージョンを設定する

バケット名は、他の人とかぶらないユニーク(独自)なものをつける必要があります。
大文字、記号は使用できません。※だから「Youtube」とかはダメ

リージョンというのは「地域」のことです。
あなたが日本にお住まいなら「アジアパシフィック(東京)」でいいでしょう。
この時、上のメニューバーの表示が「グローバル」となっていることを確認してください。

②オプションの設定

オプション設定ページは何もいじらず「次へ」で飛ばします。

③アクセス許可の設定

同様にアクセス許可設定ページも何もいじらず「次へ」で飛ばします。

④バケット完成

S3バケットにファイルをアップロードする

いよいよここでファイルを転送します。
後ほど「Amazon Transcribe」で読み込む際にここの格納先情報が必要になりますのでPC上のメモ帳などにメモしておきましょう。

今回はサンプルとして落語の「寿限無」を選んでみました!(よりにもよって難易度高いやつを・・・)
ちなみにファイル名は日本語とかバグの元だから英数文字に変えた方が無難。

というわけでここでファイル名の変更も格納先情報の記憶(コピーパス)もできるよ!

Amazon Transcribe:文字起こし編

準備ができたらいよいよ実際にAmazon Transcribeで文字起こしをしていきましょう!

Amazon TranscribeでJOBを作成する

上のタブ「サービス」から検索で「Amazon Transcribe」を呼び出します。

「Create transcription job」!

①Job settings

Name:Job名。自分でわかる適当な名前を英数文字で。
Language:Japanese(Japan)を選択。

②Input data

Input file location on S3:音声データを格納したS3の場所。(コピーパスで持ってきたディレクトリ)
s3://S3のバケット名/音源ファイル名
となっていることを確認してください。

Format:自分でアップロードしたファイルの拡張子(ここではmp3)を選択。

③Output data

ここはそのままいじらなくてOK
ここまでできたら「Create」!

Amazon Transcribe:文字起こしを待つ

作業が終わるのを待ちます。
ステータスが「In progress」は作業中
「Complete」に変わると書き出し完了です。ダウンロード期限は90日間のようです。

Amazon Transcribe:文字起こしにかかった時間


こちらが作業結果です。

動画:5分10秒
書き出しにかかった時間:3分54秒

悪くはないですね。

Amazon Transcribe:文字起こしの精度と比較

実際にAmazon Transcribeが起こした文章はこちらです。
今回サンプルに「寿限無」というなかなかに難易度の高いものを選んでしまったので大目にみてやってください笑

そして長いけれど「Amazon Transcribe」と「YouTube搭載の文字起こし機能」と「人間の丁寧な仕事」この3つを比較しましたので、よろしければお付き合いください。

結論から言いますと、結構ひどい笑

でもYouTubeの文字起こしといい勝負。
あえて勝敗をつけるなら「五劫の擦り切れ」の説明部分で、「天女が三千年に一度」って天女がちゃんと認識できていたからAmazon Transcribeの勝ち!

落語って江戸弁で話すようなところがあって、癖があるし、聞き取りにくいよね?その割に健闘しました!

【Amazon Transcribeの文字起こし成果物】

す 子供 さん が 生まれる と 昔 は 者 主義 の ご 隠居 さん とか お 寺 の 和尚 さん に 名付け親 に なっ て もらう なんて 方 が 随分 と やっ た だ そう で ござい ます けれども 佐々 ちゃん や 今度 は 生まれ た お前 さん とか の 男の子 丈夫 で な の? 息 を する よう に という ま お前 さん の お あ そんな 願い で それで こう こんな 名前 が いい ん じゃ ない か 紙 に 書い て ある から 言う だ から あ そう です か いえ むしろ 自分 これ も あっ た 名前 です ね これ 何? 何 な ん です けど 樹 旬 エム 順延 も 五 行 の 擦り切れ 会社 ディス 引用 の 水 冥罰 運用 罰 ぐらい 罰 クー 寝る ところ に 住む ところ 破ら 工事 の ブラック を じ パイ ポ パイ ポ パイ ポ の 週 リンガ に 衆院 の グリンダ い グリンダ 伊野 尾 ぽん ポピー の ポンポン な あの 超 球面 の お 経 経 営 陳 ところ 強打 の え こんな 名前 が ま いや ソレ 全部 付ける じゃ ない よ 人 ずつ 訳 な 寿命 が 限り なく 続く ところ で ソレ 寿命 みたい だ な うん 天女 が 三 千 年 に 一 度 つ 衣 で もっ て 大きな 岩 を なぜ 言わ な 擦り切れ て 亡くなる 長い 時間 が 一 個 ソレ の 五 倍 だ あ それから ま なん だ な え? 海 の この 砂利 とか 水 とか 魚 なんて な とっ て も 取り 尽くせ ない ぐらい 数 が 知れ ない と いう ので 海 蛇 に 水 や 彼 も めでたい それから 水 冥罰 運用 罰 フライ 罰 と なる 海 の 水 とか 雲 とか 風 どっ から 来 て どこ へ 行く の か 果てし も ない という それで ま めでたい という こと に なる な あ それから クー 寝る ところ に 住む だ から これ 人間 食事 揃っ て ない と 幸せ に は なれ ない という やつ だ それから 破ら 工事 の ブラ 工事 これ は やぶ コーチ という 植物 が ある し て はる 若葉 を 生じ 夏 葉 を 茂ら せ て 秋 に 実 を つけ て 固有 に 赤い 実 を 添え て これ は 一 年 十 枯れる こと なく 栄え てる という 形 だ で そこ まで は 分かっ た ん です けど ね この パイプ パイプ パイプ の シュー リン 元 衆院 元 の グリーン 大 グリーン 代 の 担保 コピー の ポンポコ なっ て これ は 無い でしょ いやいや 恐れ な です ね 昔 パイプ という 国 に え? シュリン 男 という 王 様 と か 五輪 大 という 起き ちゃっ た の が 二 人 の 間 に でき た の が ポンポコ ピート ポンポコ な という 人 の 王子 様 みんな 町名 で 国 が 酒井 ため だっ た んで 最後 が 長く し た し 生命 と か 言っ て え 徴求 め 長く 助ける とか いっ て 朝食 ま この 中 の どれ か を 選ん で 使える 選ぶ どれ か 嫌 だ って こっち 選ん で もしも の こと が あっ て あ こっち に 逸れ ない でしょ これ もう みんな 付け や やめ て これ も 皆 いただき ます から って いう んで この 長い 名前 を 付け て ま その 名前 の 画面 で ござい まし た か な? うん すくすくと 育っ て 大きく なる ガキ 大将 近所 だ な と 思っ た 喧嘩 し て え? 泣かさ れ た この 青山 さん の ところ に い つけ に 来る なんて いう の が あっ た ん だ そこ で おば あ ちゃ こんな 年 も 君 僕 に 切り替え たり 制御 じゃ 何 か うち の 十 年 も 地面 を こう のす 力 で 会社 に 信用 の 水 冥罰 運用 罰 フライパン 含ん でる ところ に 住む ところ やっぱり 工事 の ブラック オージー パイ ポ パイ ポ パイ ポ の 承認 が に チューリング の 五輪 大 グリーン ライン の ポンポコ ピン の ポンプ の 調教、 目 の 千代 ちゃん の 頭 打っ て 来 や 家 の 人 が 熱く なる ところ に 住む 人 の 五輪 の 根本 の ポンポコ キン ちゃん の 頭 打っ て 昆布 こちら い ちゃっ た です って ああ じゃ うち の 自分 の 時間 は 午後 時 から 言える 分野、 次 は ばつ 三角 と コメント 含ん でる ところ に 住む ところ やっぱり 工事 の お腹 いっぱい いっぱい いっぱい この 書類 の 商品 が 上 で 軍隊 の ぽっぽ こ ぽっぽ の 長期 近傍 の 頭 打っ て 各 しょうが ねえ な キン ちゃん 悪かっ た あと で もっ て うち の 違い は もちろん 高校 の 教育 に 書い て ある 国 別 に まとめ て 机 の 上 の ぽっぽ こ ぽっぽ から その 前 に 薬 漬け て やる こと に 合意 コブ あれ 午後 なんか どこ に も ねえ じゃ お願い ええ あんまり 名前 が 長い から! こ ぶ が 引っ込んじゃっ た

【YouTubeの機能についている文字起こし成果物】

子供さんが生まれると昔はあーもの主義のご隠居さんとかお寺の和尚さんに名付け親になってもらうなんて方が随分と会ったんだそうでございますけどさぁさぁあったんやホンダ生まれた音が遺産とかの男の子丈夫で長生きをするようにと言うまあ思いさんのそんなねえ村で合コン生音がいいんじゃないか紙が入ってあるから言うんだからアースか会える種魏軍これまたなんて名前ですねこれなんですけど j 6順延もご鴻巣劇でカイセリスイングも修行罰畝を罰フライばつくうねるところにすむところやぶらこうじの分等工事パイポパイポパイポのシューリンガンシューリンガンのグリン第二林台の本ポピーのぽんぽわなの長弓目の超ええええいいいいいいいチントレそうだろえーこんな長いなまぁいらそれ全部つけるんじゃないよ一つっつわけない寿命が限りなく続くところでそれ順天だな運転は3000年1 dots 衣でもって大きな岩をなぜていは祭切れてなくなるならない時間が入っ施工それの5倍だああそれからまあなんだな海のをのジャニーとか水とかさがなんてなとっても取り尽くせないぐらい一馬しれないというので買いジャニス員がこれもめでたいなそれからアースいよう罰うんうんバズ風来罰となり海の水とか雲とバカじゃどっから来てどこへ行くのかさて子もないと言うされでも雨で炊いたいう形にならなああそれからなうーんくうねるところにすむた彼これ人間に植樹揃ってないと幸せにはなれないってやつなってからや村こうじのぶらこうじこれはヤブコウジという植物があります春若葉を小人月葉を茂らせて秋に実をつけて冬に快眠を添えたら一年中枯れることなく寒河江てるたいう形だそこまでわかったんですけどねこのパイポパイポタイポのシューリンガンシューリンガンの宮人台宮林台のポンポコピーのぽんぽこになってこれはないでしょうよいいよそれな昔パイプという国naoしゅーりんがんという王様ともうリング愛というを希釈者も2人の間にできたのはポンポコピーとポンポコナーという二人の王子さま皆長名で国が社外ためでたね最後が足掻くしたし命とか言って超級目奈落助ける高いて超好きまあこの中のどれかを選んで使えるんエラっどれかやったってこっち選んでもしものことがあってあプッチン木それないでしょそれもうみんなつけば止め理恵これもみんないただきますからってんでこの長い名前寄せまあその名前の加減で御座いましょうかなうんすくすくと育って大きくなるが利いたでしょ近所動画と思った見解していく泣かされた子が親もさんのところに言いつけに来るなんていうのが今だぞ今でオーバーチャーをべちゃっとこんなねー純減も9分後コーンウォール州に切りか良い手に水ます異名罰んよっフライパ工夫でれたバラに図太くa 6時のブログ時 popeye ポパイプルきゅんビッチっはppap ポッドちょちょちょオイラがは束打ったからこんなに大きな子ができちゃったのじゃ何かいうちの10年も10年も高熱力で会長アリスイン用の専用罰運用罰オーライ罰コーンねるところにすむところが村こうじのぶらこうじパイポパイポパイポの表鈴丸忠倫元の五輪第宮林台のポピーのポンプオーナーの調教の長介金ちゃん頭グって来パルライアーだちょいと舞さん聞いたうちの順次分国んですよ入れ海砂利水魚無線原発業が to fly 分厚くなるところにすむところやぶらこうじのぶらこうじパイポパイポパイポのシューリンガン駐輪が脱ぐ輪台グーリン街の今ポピーのポンポコナーの供給年の挑戦欽ちゃんが頭振って午後こちらへちゃったんですっていやうちの準備ワゴンじゃなきゃいけず運用前が抜群のパス web 分でってこれにするところやポーチボレーがいっぱいいっぱいパイプのショルダー書類がのゴールで軍でのコピーのぽぽなぁの供給など長束県僕の頭振ったこしょーがねーなー欽ちゃんあるだっ思って家の柱が矛盾項目4発くんってキャラオンリーのブログ細いパイプの種類のいっしょリネンの5連大紅蓮のポピーの pop が何度超級までの直近8区小本いったからその前薬付けてやるこっち鯉昆布あれこのなんかどこにもねえじゃねえかええっあまり名前ならないからここが引っ込んじゃった

【人間が聞いて丁寧に文字起こしした成果物】

子供さんが生まれると昔は物知りのご隠居さんとかお寺の和尚さんに名付け親になってもらうなんて方が、随分とあったんだそうでございます。けれども

「さぁさぁ、はっつぁんや。今度生まれたお前さんところの男の子、丈夫で長生きをするようにという、まあお前さんの、うん、そんな願い、それでこんな名前がいいんじゃないか、紙に書いてあるから読んでごらん。」「ああ、ああ、そうすか。見して。あれ、随分これまたなんか長いスね。え、なんなんスか。」「寿限無 寿限無 五劫のすりきれ 海砂利水魚の水行末 雲来末 風来末 食う寝るところに住むところ やぶら小路のぶら小路 パイポパイポ パイポのシューリンガン シューリンガンのグーリンダイ グーリンダイのポンポコナーのポンポコピーの長久命の長助ぇぇぇぇ、ぃぃぃぃぃぃぃ。ちーん!てこらお経だねこれ」
「えー?こんな長い名前」「それ全部つけるんじゃないよ。ひとつずつ訳がある。寿命が限りなく続くところでそれ寿限無てんだな。天女が3000年に一度って衣でもって大きな岩を撫でて、岩が擦り切れてなくなる長い時間が一劫、それの5倍だ。ああ、それからまぁ、なんだな。海の砂利とか水とか魚なんてなぁ、取っても取り尽くせないぐらい数が知れないというので海砂利水魚。これもめでたいなそれから、水行末 雲来末 風来末、つまり海の水とか雲とか風、どっから来てどこへ行くのか、果てしもないという、それでまぁめでたいということになるな。それからな、食う寝るところに住むところ、こら人間衣食住揃ってねぇと幸せにはなれないてやつだ。そいからやぶら小路のぶら小路これはぶら小路という植物がある、春若葉を生じ、夏葉を茂らせて、秋に実をつけて冬に赤い実を添える。一年中枯れることなく栄えてるということだ。」「そこまではわかったんですけどね、このパイポパイポパイポのシューリンガンシューリンガンのグーリンダイ、グーリンダイポンポコナーってこれはないでしょ」「いやいや、それな、昔パイポという国に、シューリンガンという王様とグーリンダイというお妃様、2人の間にできたのがポンポコピーとポンポコナーという二人の王子さま。みな長命で国が栄えた、めでたい!そして最後が長く久しい命と書いて長久命、長く助けると書いて長助。まぁ、この中のどれかを選んでつける。」
「選ぶ?どれか?いや、だってこっち選んでもしものことがあってこっちにってそれないでしょそれ!」
「もうみんなつけます」「え、それは止め 」「いえいえこれもう、みんないただきますから」ってんでこの長い名前をつけて。
まぁその名前の加減でございましょうかな。すくすくと育って大きくなるガキ大将。近所の子供とけんかして、泣かされた子が親御さんのところに言いつけに来るなんてのがあったんだそうで「おばちゃーん、おばちゃんとこのね、寿限無 寿限無 五劫のすりきれ 海砂利水魚の水行末 雲来末 風来末 食う寝るところに住むところ やぶら小路のぶら小路 パイポパイポ パイポのシューリンガン シューリンガンのグーリンダイ グーリンダイのポンポコナーのポンポコピーの長久命の長助がおいらの頭ぶったからこんなに大きなこぶができちゃったの」「じゃ、なにかい?うちの寿限無 寿限無 五劫のすりきれ 海砂利水魚の水行末 雲来末 風来末 食う寝るところに住むところ やぶら小路のぶら小路 パイポパイポ パイポのシューリンガン シューリンガンのグーリンダイ グーリンダイのポンポコナーのポンポコピーの長久命の長助が金ちゃんの頭ぶってこぶ・・・あらやだ。ちょいとお前さん、聞いた?うちの寿限無 寿限無 五劫のすりきれ 海砂利水魚の水行末 雲来末 風来末 食う寝るところに住むところ やぶら小路のぶら小路 パイポパイポ パイポのシューリンガン シューリンガンのグーリンダイ グーリンダイのポンポコナーのポンポコピーの長久命の長助が金ちゃんの頭ぶってこぶこしらえちゃったんですって。」「なにをー?じゃ、うちの寿限無 寿限無 五劫のすりきれ 海砂利水魚の水行末 雲来末 風来末 食う寝るところに住むところ やぶら小路のぶら小路 パイポパイポ パイポのシューリンガン シューリンガンのグーリンダイ グーリンダイのポンポコナーのポンポコピーの長久命の長助が金坊の頭ぶって・・・しょうがねぇなぁ。金ちゃん悪かった。後でもって、うちの寿限無 寿限無 五劫のすりきれ 海砂利水魚の水行末 雲来末 風来末 食う寝るところに住むところ やぶら小路のぶら小路 パイポパイポ パイポのシューリンガン シューリンガンのグーリンダイ グーリンダイのポンポコナーのポンポコピーの長久命の長助によーく小言言っとくからその前に薬つけてやる。こっちへこい。こぶ・・・こぶなんかどこにもねぇじゃねぇか。」「えーん!あんまり名前が長いからこぶが引っ込んじゃった」

まとめ

YouTubeを書き起こすなら、一度音声データ(MP3)に直さないといけないという一手間をはさむので(別記事予定)、それを考えるとこのどっこいどっこいの精度であるならばわざわざAmazon Transcribeを使わなくてもYouTubeに標準搭載の機能で良し・・・という結論です。

ただ、インタビューであったり、議事録等、すでに音声データで持っている場合にはこのサービスは非常に有用だなと思いました。

このくらいの精度であっても、まったく何もないところから聞いてベタ打ちしていくことを考えたら下地として起こしてもらって、それを手直ししていく方が断然負担は軽減されますしね。

ちなみに料金体系も非常にお安く(1ドル110円換算)

2分半程度のデータなら約7円
30分(私的に一番扱う頻度の高い)で約80円
120分(平均的な会議の議事録)で約320円

通常、人間に文字起こしを依頼すると30分のデータで4〜5,000円になります。
それがAmazon Transcribeなら80円ですから、費用対効果としては十分に価値ありと言えると思いました。

というわけで、お仕事で文字起こしの必要ある方々のご参考になりましたら幸いです。
ご精読ありがとうございました。