ペンとサイコロ -pen and dice- BLOG

ボードゲーム・3Dプリント作品・3DCG制作を行う「ペンとサイコロ」のブログです。公式サイトはこちら→http://penanddice.webcrow.jp/

これなら欲しい!メモに使えるボイスレコーダー

ボイスレコーダーは会議やインタビューの録音や、メモ用に使われている。
特に記者には「七つ道具」に挙げられるぐらいメジャーだが、一般のサラリーマンに普及しているかと言えば微妙
やっばり録音したあとに「文字に書き起こす」という作業が入るのは大きいと思う。

Digital Voice Recorder / kev_hickey_uk


個人でボイスレコーダーを使う用途として大きいのは「メモ」だと思う。
書く時間が無い時や、思いついたことを歩きながら記録するのにボイスレコーダーは向いている。
しかし「いちいち後で文字に起こすのが面倒」だし、「自分の声を聞くのが抵抗がある」という人も多い。

音声認識は難しい

では音声認識で、録音した文字を自動で書き起こしてくれたらいいんじゃないか?
と思うが、音声認識は技術的にかなり難しい。
音声認識なんて、キーボードの代わりに声で入力するだけじゃないの?」
と思うかもしれないが、決定的な違いが三つある。

  • 音の認識がそもそも100%ではない
  • (話し言葉には)句読点がない
  • 変換内容の選択・修正ができない


つまり、音声認識をキーボード入力に例えると
「たまに打ち間違いがあり、句読点なしの文章をスペースキーで一発変換」
ということ。
これじゃ変な文章になるのも仕方ない。
このため音声認識が実用化されているのは、上の条件のいずれかが無視できる用途になっている。
たとえばこんな所。

  • 医療カルテ入力
    • 専門用語ばかりなので予測変換の精度を高められる(あまりキーを触りたくないという事情もある)


Doctors Break Ground with Voice Recognition Medical Capabilities in Iraq / MC4 Army

  • 役場の議事録


そういや昔IBM音声認識ソフトをバンドルしたパソコン(Aptiva)を宣伝してたなぁ。
今考えても悪くない変換精度だったんだけど、まぁ手で打つ方がよっぽど早いわ。
香取伸吾がCMしてて、「君の作ってくれたべったら漬け・・・」というのをCMで変換してた。
実際試してみても「べったら漬け」だけ妙に正確に認識してたのが思い出深い。
[asin:B003RF50X2:image:small]
以上、閑話休題

音声認識ボイスレコーダー

さて、ボイスレコーダーにこういう機能があったらどうか、を考えた。
ボイスレコーダー音声認識機能をつけるんだが、この機能があれば音声認識の使い勝手を向上できるんじゃないか。

  1. 「ファイル作成」ボタンと「録音」ボタンを分ける
  2. 句読点入力キーを本体に設ける
  3. 音声と認識文字を残しておいて、後で変換できるようにする。


一つ目、人間は「あ〜」とか「え〜と」とか無意識に声を出しながら話している。
音声認識を差せる際に、このつぶやきを辞めながら話をしないといけない。
これが、結構なストレスになる。
そこで、一連のメモを作る「録音」ボタンとは別に、音声認識ボタンを設ける。

Voice Recognition / diongillard

音声認識はこのボタンを押しているときにしか行わない。
それって逆に面倒じゃない?と思うかもしれないが、テレビ会議では無駄な音声を入れないミュートボタンが
標準装備で、慣れると普通に使えるのでこれは慣れると思う。
二つ目、上にも書いたとおり音声認識を難しくしている要因の一つが句読点
そこで句読点はキー入力にすることで、後から見やすい文章にする上、音声認識の精度も向上する。
三つ目はもうあるかもしれない。
取り込んだ音声データはソフト上で変換をかけることで、正しい変換を見つけられるようにする。
つまり普通の日本語入力ソフトのように、変換候補から選ぶようにする。


原理的にはスマートフォンのアプリでも可能だが、
歩きながらという使用シーンを考えると録音開始や入力キーはタッチパネルでなく、ボタン(キー)でないと使えない。
なぜなら画面を見ながら操作できないから。
ボイスレコーダーはすごく高機能で使いやすいが、今ひとつ普及しないのはこの音声入力のためだと思う。
ICレコーダと言えばやっぱりオリンパス、なのか?ぜひ作って欲しい。

IC recorder / diloz