以前の記事で紹介した音声入力を実践する中で、感じたことがあります。
音声入力のボタンを押した瞬間に頭のモードが切り替わるというか、さっきまで頭の中に浮かんでいたはずの内容が途端に出てこなくなるのです。
この現象がなぜ起こるのか、どうすれば自然に話し始められるのか、AIの力も借りながら探ってみました。
なぜ、言葉が詰まるのか
自分なりの仮説
まず私が考えた要因は以下の2点です。
特に①について、たとえ後で自分しか確認しないとしても、「記録される」というプレッシャーは小さくありません。
その結果、実際の会話とは違うぎこちなさが生まれます。
AIの説明
続いてAIに聞いてみたところ、どうやら本当に使っている脳のモードが切り替わっているようです。
以下、Claudeが生成した回答を一部掲載します。
脳科学的には、「表現モード」ではブローカ野とウェルニッケ野(どちらも左脳領域)が活発にはたらき、「監視モード」では前帯状皮質(前頭葉)がはたらくとのこと。
まさに使っている脳の部位が異なるという、非常に納得感のある回答でした。

(余談:AIの比較)
今回、同じ質問をChat GPT、Gemini、Claudeにしてみたのですが、回答の質は圧倒的にClaudeが高かったです。アカデミックな領域で強いAIなのかもしれません。
再び自分なりの考察
そもそも「話す」という行為は、本来は目の前に相手がいるものです。
「Hey, Siri」や「OK. Google」を使っている人が(少なくとも私の周りでは)まだまだ少数派であることからも、一人で機械に語りかけるのは不自然だと私たちは認識しており、それが脳のモードの切替にも影響していると思われます。
状況は異なりますが、何かのプレゼンをする時も同じ現象がよく起きます。
ただでさえ「評価を受ける」という場面で、「用意した原稿どおりに話そう」という意識になった瞬間、言葉に気持ちを乗せられず、良いプレゼンはできなくなります。
解決策は「脱・完璧主義」
解決の鍵は、再びAIの言葉を借りれば「完璧主義を捨てること」です。
ただ、私のような偏差値教育のど真ん中を歩んできた人間が、いきなり「完璧主義を捨てましょう」と言われても厳しいものがあります。
そこで最近試しているのが、「身体感覚を取り入れること」です。
具体的には以下の点を意識することで、「表現モード」に切り替えやすくなっていると感じます。
- 実際の聞き手を思い浮かべる
- 身振り手振りを大きめにつけて「伝える」感覚を高める
- 「えー」「あのー」などのフィラーを恐れない



英語を話すしかない状況に陥った時もボディランゲージの大切さを実感しますが、イメージはこれに近いです。
まとめ
今回は、音声入力を実践する中で得た気づきを記事にしました。
「話す」という行為は、単に声を発するだけでなく、脳を能動的に働かせるものです。
思考を言語化し、誰かの心を動かす。そんな営みがあるからこそ、文章作成はクリエイティブで楽しいのだと思います。
そして音声入力の精度は日々向上しているので、これから数年間でキーボード入力の割合と逆転する未来も十分あり得ます。私が昨年どハマりした中国のSF小説「三体」でも、数百年後の未来では音声入力が主流になっていました。
「音声入力のコツ」を身につけた人がシゴデキ人間として重用される時代が来ると信じ、今のうちから鍛えておこうと思います。



