コラム- 文字起こし・議事録作成 株式会社トークアトラス

コラムCOLUMN

AIの進化と文字起こし もう仕事はなくなるの?

2024.4.29 文字起こしについて

文字起こしの仕事はもうなくなるのではないか、AIに取って代わられるのではないか、と心配している人は多いと思います。

「もうこれからは議事録なんてAIがやる時代だから、文字起こしの外注は必要なくなるでしょ」と言われたり、「これからはお仕事厳しくなりますね」と同情されることもあります。本当にそうなのか、文字起こしの実務をしている者として、現時点での感想を書いてみたいと思います。

結論から言うと、現段階では当分なくならないはずです。なぜかというと、AIの音声認識技術はまだまだ発展途上だと思うからです。“最後の仕上げだけ人間の手が必要”というレベルではないと感じています。最初から最後までしっかりチェックしていかなければならないし、AIが不得意とする要素を可能な限り排除しないと精度が出にくいものだと思います。

人間の会話はそれほど単純ではありません。アナウンサーのように滑舌よくきれいに発声できる人が一人でマイクに向かって一般的な内容を話せば、それはAIで十分な結果が出るでしょう。ところが、一般の会議ではそれとは真逆の状況になることが多く、AIが苦手とする要素にあふれています。

利用シーンによっては確かに便利に使えると思います。原稿を読むだけのような形式的な要素が強いもの、あるいは、発言の中から重要な部分を抽出し、要約としてまとめるような場合には、“AIを使ってあっという間に議事録完成”というようなことが可能かもしれません。しかし、ある程度まとまったものを全文起こしにしようとすると、修正にはかなりの手間が必要で、そのための労力と時間は必ず計算に入れておかなければいけません。

つまり、AI音声認識で起こして多少の校正を施せば問題ない分野と、文字起こし業者に外注する必要がある分野とは分かれていくのではないかと思います。

また、AIで簡単にできるからこそ、これまでは音声情報だけだったものが新たにテキスト化の対象になることも考えられます。より活発な需要が出てくるのではないかと思います。

  • 録音状態が著しく悪い音声は認識率が一気に落ちます。できるだけクリアな録音を心がけることでその後の作業が楽になります。これはAIを使わない手動での起こしも同じですが、特にAIを使って起こす場合は重要です。
  • 言うまでもなくセキュリティには十分配慮しなければいけないので、信頼できるツールであるかどうかの確認は重要です。
  • 認識が難しい専門用語、一般の人にはわからない固有名詞や略語などは、後から一括変換または単語登録をして、使い勝手がよくなるようにしていきましょう。
  • 話者の特定、固有名詞の表記、引用文などは、正確かどうか十分チェックする必要があります。
  • 見出しを入れたり、「拍手」や「挙手」など音声ではない状況の記載などは、必要に応じて後から追加しましょう。

今までいくつかのAI音声認識を試してみましたが、今のところ、まだ期待どおりのものに出会っていません。一から起こし直したくなるような経験は何度もありましたし、結果的に時間と労力はそれほど変わらないのではという失望感を抱いたこともあります。

ただ、要約についてはAIはかなり力を発揮してくれるような気がします。認識率が悪く完成度が低い文章でも、要約は大事なところをしっかり押さえていることがよくあります。ですので、アウトプットは要約だけ、詳細な全文起こしは不要という場合は、AIは力を発揮してくれるのではないでしょうか。ですが、それもやはり最後は人の手を加えて仕上げをする必要があります。

質が良いにこしたことはないけれども、速さのほうが大事というときは、AIが真価を発揮するでしょう。テレビの字幕やYouTubeなどで、思わず笑ってしまうような文字起こしを見かけますが、とにかく一刻も速く人の目に触れることに価値がある場合は、取りあえず間違いはあってもAIで速報版を、その後に詳細で丁寧な文字起こしを、という使い分けを考えるのも手かと思います。

これから文字起こしの仕事を始めようとする人が、専用の再生ソフトを検索して探しても、AI音声認識機能のものが前面に出てくるので、そもそも手作業で起こすものではないと思う人も増えてくるでしょう。

AIが起こしても人間が起こしても、それはあくまで手段なので、最終的な成果品が良いものに仕上がっていれば問題はないわけです。ただ、AIに頼りすぎて整える作業をいい加減にし、十分に修正が施されていないものを完成品として納品していれば、ワーカーとして信頼を失います。

また、録音状態が非常に悪いときには、AI音声認識は力を発揮できませんので、手動で入力することに切り替える柔軟性が必要です。

きっと将来はもっとAIによる認識の精度が上がってくるのだと思いますが、最終的に最適な状態に仕上げられるのは、文字起こしの経験を積んだ人間ではないかと思います。文字起こしをする人たちこそが一番効果的な使い方ができると思うのです。単純なタイピング作業の話ではなく、人の話し言葉を文字に置き換えて表現する技や工夫、そういう経験値があるわけですから。逆に、今の段階でもAI音声認識より低いクオリティの成果品しか出せなければ、コスト削減のために仕事はなくなっていくでしょう。それはこれから様々な分野で同じことが起こってくると思います。

まとめとして、当たり前ではありますが、人としての経験や技術を発揮できる部分、そういうものがあれば仕事はなくならないのではないでしょうか。


    AIによる音声認識や、既に作成された文字起こし文書の修正・整文等は、
    「お問い合わせ」からご相談ください。
    (録音状態が著しく悪い場合はお引き受けできないことがあります)

同じカテゴリーの記事

お見積もり・ご注文