AutoMemo Sとは
このブログでは以前、ソースネクストの「AutoMemo」を紹介しました。その記事がこちら。
今回、その進化版である「AutoMemo S」を試用する機会を得ましたので、使い勝手などをレポートします。
機能・特徴
初代の「AutoMemo」はスティックタイプの形状で、本体には録音のOn/Offボタンしか付いていないようなシンプルな作りでした。そのため、録音した音声を聞いたり、変換されたテキストを確認するには専用のアプリをスマートフォンにインストールする必要があったのです。
今回のAutoMemo Sは、2.83インチ 480x640pxのタッチディスプレイを備えていて、それまでのアプリでしていたことがこの一台でできてしまうようになっています。各種設定はもちろん、録音した音声を再生したり、変換されたテキストを確認したりすることが可能です。
一般的なボイスレコーダーと比べると、
- 音声データはクラウドストレージに保存されるので、残り容量を気にする必要がない。保存件数、期間に制限はなし。
- AIが文字起こし(音声をテキストへ変換)してくれる。対応言語は日本語、英語、中国語など、72言語(ただし、一度の変換では一つの言語史か指定できません)。
- メールに結果(テキスト)と、音声ファイルへのリンクを自動送付してくれる。
- Dropbox, OneDrive, GoogleDriveに音声データ、テキストデータを自動保存してくれる(事前に連携設定が必要)。
- テキストを見て指示し、その場所の音声を呼び出しできる。
- 利用条件として、Wi-Fi接続と、GoogleアカウントもしくはApple IDが必要です。
なお、文字起こし機能は無料と有料のコースがあります。
プラン | ベーシック | プレミアム | 追加10時間 |
料金 | 無料 | 980円/月(税込み) | 1,480円/回(税込み) |
内容 | 月に1時間分変換 翌月繰り越しなし | 月に30時間分変換 翌月繰り越しなし | 10時間分変換時間追加 翌月繰り越し可能 |
2022/3/31までの期間限定で、三ヶ月間分のプレミアムプランが無料になるキャンペーンも実施中。ただし、条件がありますので、詳しくは公式サイトを見てください。
概観
本体を見ていきましょう。スマートフォンと比べるとサイズ感はこんな感じ。
92x54x12 mmで本体重量は約88 gとなっています。表面にはディスプレイと録音ボタンがあります。
附属同梱物は各種ドキュメント。
そして充電器です。本体側はUSB Type-C端子になっています。
なお、待ち受け電池持続時間は120時間、録音電池持続時間は16時間とのこと。
裏面は金属ですっきり。
底面に端子類があります。写真左からイヤホン端子、USB Type-C端子、マイク端子となっています。
天面はスピーカーと、見えないですがマイクがあります。
右側面には電源ボタンがあります。
設定
初めて電源を入れると設定モードになっています。指示に従って設定をしていってください。
まずはWi-Fi接続が必要になるので、設定してください。そして、GoogleもしくはAppleのアカウントも登録・連携が必要です。
上記の通り、私は以前、前の機種で既にユーザー登録していたのでそれがそのまま引き継がれた(そのまま使われている)ようです。最初だったらプラン選択をすることになると思われます。
これで基本的な設定は完了です。あとはコマンドを呼び出して細々と設定を変更できます。テキスト化する時の言語(デフォルトは日本語)だとか、画面の明るさだとか、そのようなもの。
テキスト化する言語を変更することももちろんできます。リストが出てくるので、選択してください。残念ながら一つしか選べません。そう言う状況があるかは分かりませんが、英語と日本語で会話をしている場合などには対応できないと言うことです。実際にどうなるのかは試してないので分かりませんが。
録音した音声データはAutoMemo用のクラウドストレージに自動的に保存されます。また、変換されたテキストはメールで送られてくるようにできます。
それに加えて、音声データ(MP3形式のファイル)とテキストファイル(通常の.txtファイル)を別のクラウドストレージにストアしてくれます。その場合は事前に連携設定をしてください。今のところ、Dropbox、Google Drive、OneDriveに対応しています。三つすべてを指定することも可能。大事なデータは複数箇所にストアするのもいいかも知れません。
私はGoogle Driveと連携させてみました。
使ってみた
ちょっと古めの小説を朗読
まずは前回と同様に、青空文庫にある魯迅の「孔乙己」の冒頭を朗読してみました。こんな感じの文章です。固有名詞は元より、「曲尺形」だの「手終い」だの、普段は使わない言葉が一杯。これは厳しいだろうとよそうされます。
魯鎮の酒場の構えは他所と違っていずれも皆、曲尺形の大櫃台を往来へ向けて据え、櫃台の内側には絶えず湯を沸かしておき、燗酒がすぐでも間に合うようになっている。仕事をする人達は正午の休みや夕方の手終いにいちいち四文銭を出しては茶碗酒を一杯買い、櫃台に靠れて熱燗の立飲みをする。――これは二十年前のことで、今では値段が上って一碗十文になった。――もしモウ一文出しても差支えなければ、筍の塩漬や茴香豆の皿盛を取ることが出来る。
魯迅 井上紅梅訳 孔乙己
読み上げた音声はこちら。私のボソボソ喋りはAutoMemo S君には厳しいかな。でも、こんな喋りの人もいるでしょう。
結果がこちらです。こんな感じでメールで返ってきます。だいぶ聞き間違いが多いかな。どんなものでしょうか。
自分のブログ記事を
コピーライトフリーの現代文って何がいいだろうかと考え、自分が書いたものしか思いつかなかったので一つ前の記事を読み上げてみました。
結果がこちら。固有名詞は置いておくとして、他もちょこちょこ怪しいところがありますかね。
結論として、テキスト化は完璧とは言い難いものの、自分で音声を聞いて文字起こしをするよりはずっとましでしょう、という感じです。
ボイスレコーダーでは録音途中にマーカーを挿入することができますが、もちろんAutoMemo Sでも可能。それ以上にAutoMemo Sは変換されたテキストの好きな場所をタッチすれば、その場所の音声を聞くことができるので、誤変換の修正をするにしても、大事なポイントを確認するにしてもかなり便利です。
議事録を良く書く人、インタビューなどの取材をよくする人などはもちろん、音声メモをするにしてもすぐに変換テキストをメールやクラウドストレージでゲットできるので便利でしょう。
ボイスメモ用に欲しいな。今、思いついたことや、本を読んでいてメモしたいことがあると、スマートフォンでSlackに書く、という事をしているけど、ボイスメモならもっと手軽にできそう。AutoMemo Sならあとからテキストで確認できるので、まさにメモとしてピッタリ。
改善希望点
もちろん、AutoMemo Sは完璧な存在ではないので、ちょこちょこと「ここは改善して欲しいな」というものがありました。
録音終了時の操作方法
録音を終了するには
- 録音ボタンを押す。
- 「録音を終了しますか」の問いに「はい」と応える。
と言う手順になります。まずは一番目の手順ですが、画面がスリープ状態(暗くなっている状態)では録音ボタンが反応しません。電源ボタンを押し、スリープ状態から戻った状態(ディスプレイに表示がされている)にした上で、録音ボタンを押さないとダメです。
二番目の手順は、録音を終わらせたいからボタンを押したのに、確認ダイアローグが出るのは面倒くさい。そうでなくてもテキスト化をしてくれる総時間が決まっている(契約パターンによって時間は異なる)のだから、さっさと終わらせたいのに、ここで数秒はロスしてしまう。録音ボタンを押してすぐに止まる仕様だとミスタッチでの誤動作が起きることを心配しているのだろうけど、何とかもっとうまい方法を見つけて欲しい。
ボリュームボタンはやっぱり欲しいかな
こちらはそれほど問題ではないかもしれない。
録音したデータの再生をするときの音量調整が、コマンドを呼び出して、写真のようなスライダーで指示をするという操作方法になっています。本体にボリュームボタンは付いていません。まあ、コストダウンのためでもあるでしょうし、そんなに音量調整を頻繁にすることもないからいいかな、これでも。
精度向上は常によろしく
私のボソボソした喋りに問題がありそうですが、とは言え変換精度向上はよろしくお願いします。翻訳機のポケトークの場合は、意識して喋るので精度も上がるのですが、普通に喋っている場合にも頑張って言葉を拾って欲しいですね。
コメント
私のように滑舌が悪くなると、いくら想像力を働かせても読解困難なそうです。
私もボソボソ喋るタイプなので、それでも完璧に声を拾ってくれるようになるとうれしいですね。