空を見上げて
トップページ » ソフト » 自作ソフト

形態要素解析

しつこくSiriに近づける試みをしている。
多分、音声入力に対して
・適切な語句で検索する
・アプリをラウンチする
などがあるが、まずは「適切な検索語句に修正する」をやってみる。

入力は音声で、これはできている。
で、それを形態要素解析にかけた。
http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html
にあるようにやるとXMLで結果がかえる。

で、第一段階で文字を分解する
名詞=そのまま
動詞+助動詞で1語にする
形容詞=そのまま
...などとして他のものは外してしまう。

第二段階で、それを目的のものに変換する。これは自分で変換辞書を持つ。
例えば「食べたい」=「レストラン」にする。

第三段階で、その結果で「場所」などを付加する。
例えば「レストラン」=「レストラン 金沢」にする。
場所はスマホならGPSだがPCなので自分で入れることにする。

でやってみた。
■実験



上が入力で「しゃべり言葉」になり、変換に出ているのが「検索語句」になる。
なんとなくそれらしい。というかそれらしくなるように辞書を作っているというか。
後は辞書を頑張っていけばそれなりになるようにも思う。ただ...面倒だ。
そもそも自分で入力と辞書を書くと、できるようなパターンしか書かないのかも。

元に戻って形態要素解析=分かち書きとも言われるが、Yahooの形態要素解析が優秀な証明を1つ。
っていうかYahooのサンプルになってたりする。

こういう場合はどう検索するのかわからない...というか何をしたいのかわからなかったりする。
そういう「エラー」も通知すべきなのだろう。

とりあえず、ここらをdllにしておく。でもYahooの規約ではバナーを入れないといけないらしいがdllだと入らない。しょうがないので中にテキストを埋め込んでおく。
っていうか公表するかは未定。辞書がYahooにあるので、Mecabとかそういうのと違って軽いというか。

後は親切から言えばTTSで応答すればいいが、PCはオフィスにあるので「余計なお世話」なのかもしれない。

で、やってて思ったことだが...
しゃべる言葉->検索語句への変換
ってのは確かに便利といえばそうだが、逆に人間がやったほうが確実だし融通性がある。
学習から言えばキーボードを覚えるより遥かに簡単というか。
例えば
「カレーが食べたい」
はすぐに
「カレー」「レストラン」「金沢」
になるだろうし
「カレーを作りたい」
はすぐに
「カレー」「レシピ」
になる。
つまりはPCにやらせるより人間がやったほうがいいというか。
やってもたいしたことがないというか、そのほうがいいというか。

それやこれやでSiriへの意欲は大幅に減退してきたりする。(^^!

by   at 09:00  | Permalink  | Comments (0)

VoiceBarのVerUp

VoiceBarだが、使っていくといろいろVerUpしたくなった。

追加した機能。

・固定キーワード追加
 これはアプリ版だけについている。
 例えば「(場所)金沢」「価格」とか頻繁に使うものを登録して使う。
液晶テレビの場合だと「液晶テレビ」だけでよく「液晶テレビ 価格」みたいな追加がマウスでできる。
 個人によってキーワードは違うので趣味のものを登録しておくとキー入力の回数が激減できる。「石川県 温泉」などはマウスだけで入力できてしまう。

・予測変換
 これもGoogleのものでAPIKitに入っているもの。
 1文字入れると次の言葉を予測してくるので選べばよい。未変換でも出てくる。
 このあたりはGoogleのツールバーもそんな感じなのでこれが秀でているということはない。

他にも音声認識のタイムオーバーなどをやっているのだが、どうもうまく機能していない感じがする。
8秒ルールに従って8秒で認識できないことになるはずが...。キャンセルすればやりなおせるのだが...。
後、作成していたらどうも途中でIEToolVarのインストーラを間違えたような気がする。m(__)m
Ver0.14から修正しておいた。

しかし、数日で何度もVerUpしてしまった。ここらで安定なのかしら?

by   at 09:00  | Permalink  | Comments (0)

WinでSiriもどき

WinでGoogleの音声認識っていうかIEで音声検索っていうのは一応完成した。
使っているといろいろ修正したくなって今朝も修正していた。

目標は高く、Siriを目指す!!(しゃべってコンシェルか)
と思ったのはいいが...。

だいたい、本来ならMSがApple(やDocomo)に先駆けてやっても良さそうなものだが、音声認識も内蔵のものはいまいちで使い物にならない。
GoogleはAndroid用のものをやるかもしれないがDocomoがやったので、手出ししないのかも。
音声認識もChromeがある。IE対応もやればできるだろうし、Googleツールバーに入れれば良さそうなものだが、HTML5のパーサ部分がIE内部だろうから無理があってこういう感じのものは作らないような気がする。
MSはと言えば肝心のOSもVistaこの方こけまくりで、UIなどから言えばXPの完成度の方が高かったような気がする。7はVistaをXPよりにしただけのような。
それより何より最初はあった「夢」がまるでなくなってきた。Win8もなんだか「後追い」でPhone7と合体したような感じだし。
さっさと引退したゲイツと現役で最後まで頑張ったジョブスの違いかしら?
それはともかく、能力的に高いPCがスマホに負けるってのは...。
最近はWebAPIでネットワーク前提なので、本体の処理はさほどでもない。認識もサーバだ。だからスマホでもWinよりも良い環境ができたりする。
ただ逆にWinでもスマホの環境はできるはずなのだが、意地なのかなかなかそうならない。PCのものがスマホになる時代からスマホのものがPCに移植される時代なのか。

音声認識そのものは、スマホのようなキーボードが邪魔な端末のためのものであるが、PCだって簡単に入力できるわけで、あった方がいいに決まっている。
MSに期待してても出来ないものはできないし、そういうビジョンも見せてくれなくなった。なのでSiriの自作という話になる。
通常なら自作なんてできるわけがないが、音声認識だって移植できるわけで。

Siriであるが、多分、会話を検索語句に変換すればいいのではないかと思ったりする。
スケージューラとかアラームとかメールとかいろいろあるにはあるが、まずは検索だろう。
それで人工無能っていうかを調べてみるが、考えるとその前に形態要素解析をやったほうが良さそうだ。
でそれも辞書があっていろいろ面倒だがYahooでできたりする。
http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html
こういうのを利用できるのは本当に有難い。
で、例えば
「カレーが食べたい」
というと名詞と動詞を抜き出して
「カレー(名詞)」「食べ(動詞)」が出てくる。
そこで動詞の「食べ」をレストランに置換する。
でレストランなので「場所」を付加する。場所はGPSがあればその地点をとるのだろうが、ここはPCは(GPSもないし)最初に登録させておいて例えば「金沢」とする。すると
「カレーが食べたい」

「カレー レストラン 金沢」
に置換される。検索するとそれらしく出る。
「カレーが作りたい」
は「作り」を「レシピ」に置き換えて付与するものはなしにする。
「カレー レシピ」に変換して検索する。
そういう簡単な動詞の変換辞書を作れば案外行くんじゃないかと。

応答をTTSで欲しい場合は...マルコフ連鎖かな?(^^!

何はともあれ、そもそも自分はどんな言葉で検索しているか?を幾つか書いてみた。
で、書いて見ると結局はそんなに多くの言葉を使っていないような気がしてきた。(^^!
多くの場合新しい語句と次のようなものの組み合わせで検索しているような。
他にも「中古」とか「オークション」とか、趣味も個人によってはいろいろあると思う。そこらは自分で登録するとする。
<場所>石川県
<場所>金沢市
<場所>金沢駅
<日付>明日
<天気>天気
<天気>気温
<場所>地図
<交通>時刻表
<交通>乗換
<交通>アクセス
<手段>レシピ
<手段>作り方
<説明>Wiki
<説明>とは?
<施設>レストラン
<施設>ショップ
<施設>ショッピング
<施設>温泉 銭湯
<目的>観光
<目的>食事
<目的>グルメ
<情報>イベント
<情報>催し
<衣類>ファッション
<食事>和食
<食事>洋食
<食事>中華
<食事>イタリアン
<食事>ラーメン
<趣味>プログラム
<趣味>工作
<趣味>園芸
<価格>価格
<価格>低価格
で思ったのは「1語か2語だけを発音し」「後は選ぶ」という。
後者は認識もないし確実だ。
例えば「液晶テレビ」のみを発音。->「液晶テレビ」「低価格」で検索。
「お花見」のみ発音->「お花見」「石川県」で検索。
今日の天気などはマウスだけで検索できる。

で早速作ってみた。(VoiceBarApp版に入れてみた)
まあSiriのような感じではないが、検索に限って言うならこの方が使いやすい。
付帯的な語句は選択なので認識しなくてもいいので、結構検索効率も良かったりする。
要は「普段行うちょっとした検索」であれば「自分の慣用句」があったほうが遥かに効率が良さそうだ。

by   at 09:00  | Permalink  | Comments (0)

人工知能Heartなど

Googleの音声認識と合成が簡単にできるのでHeartという人工知能を動かしてみた。
Heartは2004年ごろのもので、Linkも切れているのが多い。
本部はここらしい。
http://www.nishiohirokazu.org/heart/index.shtml
ただ、こちらは支部らしいが、ドキュメントなども残っている。
http://www.teratti.jp/heart/
プログラムがソース付で配布されているのが有難かった。
対話相手は標準(?)の水瀬すみれになっているが、他にも以下で人格が配布されている。沢山あるようだ。
http://www.vector.co.jp/vpack/filearea/win/amuse/joke/heart/
デザインの素敵なのもあった。
http://www.geocities.co.jp/Playtown-Domino/4476/game.html
人格エディタもありタグも豊富で凄いプロジェクトだったらしい。
後でいろいろ試してみると、かなり優秀な部類だった。

他のものには移植していないが
http://www.din.or.jp/~ohzaki/uzura.htm#study
のようなものや下にLinkもあってそういうものもやれば使える。
人工無能はここにあるように

あるキーワードに対する反応を登録していき, そのキーワードが会話の中に現れたときに登録した反応を話す. 登録されたキーワードがなかった場合は, あらかじめ別に用意してある反応用の辞書からランダムに話す.

みたいになっている。あらかじめ人格がある場合、反応は人格によって決まる。ただ、登録のないものに対してはランダムな反応になる。(そこがいいのか...。)
使っていても成長がないのは悲しいので、やはり学習型あたりが面白いかもしれない。
しかしこれも欠点がないわけではない。

サーバに設置するものもある。
・人工無能「葵」
http://marie.saiin.net/~kisuku/munou/
辞書が増え続けるのでメンテがいるらしい
・AEM-060D
http://www.ycf.nanet.co.jp/~skato/muno/AEM/060d.html
辞書型ではあるが、辞書を入れ替えするらしい。
ログを見ると会話が成り立つのはかなりレアみたいだ。
http://www.din.or.jp/~ohzaki/uzura.htm
の「うずら」はニューラルネットを使っているのか優秀みたいだが、ソース公開はない。
他にも...

http://crocro.com/write/web_ai/app/himane/index.html
Webからキーワードをひらうもの?


http://www.geocities.jp/tomock/exa.html
このあたり少し会話が成り立つ感じ。

面白いけどピークはどうも2004-6年ほどで、後はいろいろあるけど会話になるのは結構少ない感じ。
迷いながらも興味だけはあるというか。

by   at 09:00  | Permalink  | Comments (0)

HeartRecogDemo

 HeartRecogDemoはHeartという
オープンソースの人工無脳(人工無能) Heart
をGoogleの音声認識・合成で動作させたものです。
Heartの説明はこちらを参考にしてください。
2004年と古いものですから、リンクが切れるかもしれません。

尚、元の(上からとった)Delphiのソースをベースに少し加えただけですが、ソースも同梱しておきます。
注)201405:Google音声認識APIでV1が打ち切られたためV2に変更。

■スクリーン

■ダウンロード(Ver0.11)
Zip版ダウンロード

1.概要
 HeartRecogDemoはHeartという
オープンソースの人工無脳(人工無能) Heart
をGoogleの音声認識・合成で動作させたものです。
2.特徴
 一応、音声で会話形式でやりとりができます。
3.インストール/アンインストール
適当なフォルダに展開し
HeartRecogDemo.exe
を起動すれば動きます。
レジストリは使用していませんので、関連ファイルを消せば消えます。
4.動作説明
 いろいろボタンはありますが「音声認識」ボタンをおしてしゃべれば会話できます。
5.説明
元々は
http://www.teratti.jp/heart/
にある
Heart Ellsworth DLL (hew.dll) 1.0.0.beta2 (489KB)
の中のdemoのソースに若干手を加えただけのものです。
人格は
Heart ver2.x
にある「水瀬すみれ」を入れました。
hew.dllとソースは
HeartProjects. All rights reserved.
になっています。
それ以外はGoogleAPIKitのものです。

【独り言】
せっかく音声認識などのdllを作ったので、その応用の第二弾です。

本当はSiriやしゃべってコンシェル風をWindowsでやってみたかったが、AppleもDocomoもGoogleのようにWebAPIを公開することは目下ないみたいです。
できればGoogleがAndroid用に作って公開してくれるのを期待したいですけど。
それにしてもPCよりスマホの方が便利になってきたような気がします。WebAPIだと非力なスマホでも実用的ですし。

で、スマホにはない音声で会話するソフトです。

by   at 07:30  | Permalink  | Comments (0)

IEVoiceBar

目標としてIEのツールバー搭載を目論んでいました。
クリップボードの監視も便利なのでつけてみたい機能でした。
GoogleのツールバーはIEの中では優秀ですが、クリップボードはIE内部では使えますが、外部のものは入りません。メールやPDFの語句もできたら便利だと考えていました。

元々はGoogleApiKitでdllはできていたのですが、ここで使ったものにflac.exeがあります。
しかしIE9ではどうも子プロセスでexeの動作はできないようです。
そのためflac.exeのdll化をやっていましたが、紆余曲折があってなかなか安定動作しません。
XPはexeを使え安定しているので安定版として公開します。(IE8だとOKだと思います。)
Vista/7は不安定というかやっているとPCにより音声関係のふるまいが不安定なので開発版として公開いたします。手持ちでは安定動作するマシンの方が多いのですが、そうでない場合も1台だけですがありました。
その場合アプリ版は安定版の構成で機能も同等なのでそちらを使ってください。
タイトルバーに張り付くのでむしろ場所も食わずIEも高速になり安定かもしれません。

アプリ版はこちら

配布はZip版のみです。

IEにこだわらない場合は...
1)GoogleChromeをインストールし
2)Chromeで以下にアクセスしPluginをインストール
Speakable Textareas
http://userscripts.org/scripts/show/108011
3)これで入力欄に音声入力ができるので
http://www.google.co.jp/
で音声検索できます。

注)201405:Google音声認識APIでV1が打ち切られたためV2に変更。

■スクリーン

■ダウンロード(Ver0.16)
XP安定版ダウンロード
Vista/7開発版ダウンロード

1.概要
 VoiceBarはWindowsでGoogleの音声認識・検索機能をIEのツールバーで利用するためのツールです。
2.特徴
・IEのツールバーとしてGoogleの音声認識が使えます。
・ジャンルを指定した検索ができます。
・認識結果をクリップボードに転送できます。
・クリップボードの内容で検索できます。
3.インストール/アンインストール
 インストーラでインストールし、コンパネからアンインストールしてください。
4.動作説明
・マイクアイコン
 これを押すと音声認識が起動します。
 Googleの音声認識になります。
・検索用テキスト
 音声認識が終わるとここに出力されます。
 キーボードでも入力できます。
・検索種類
 検索するサイトの種類が選択できます。
「一般」「地図」「ニュース」「画像」「動画」「YouTube」「Amazon」から選択が可能です。
・検索ボタン
 「テキスト」「種類」から検索します。結果は別のタブで開きます。
・Copy
 検索テキスト(=音声認識結果)の内容をクリップボードにCopyします。
 これは例えば入力部分で音声入力を使いたい場合に発声・認識後、Copyすれば、入力部分に貼り付けて使うことができます。
・その他
 クリップボードを監視しており、クリップボードにテキストが入ると検索窓に入ります。このことで通常のアプリ(メールなど)の語句も検索できます。

5.ライセンスなど
・libFLAC.dll

http://flac.sourceforge.net/
で公開されているdllのソフトです。(開発版に含まれています)
改変はしていませんが、BSDライセンスになります。
「再配布する際に著作権表示を行うことのみを条件とする」
ためここに表記いたします。

【独り言】
まずIEのツールバーというのはIEを親とするdllになります。
で、IE9だと思うのですが、そのdllの子プロセスでexeが起動できません。
つまりツールバー型のランチャーみたいなものは作れないような感じです。(危険だからだと思います。例えば悪意のあるツールバーでexeでクラッシュもできます。ただdllでも同じような気がしていますが。)
音声認識ですが、IE9では子プロセスで開発Kitにあるflac.exeが呼べませんでした。
そこで、無理やりLibFlac.dllでやってみました。ただ、親がIEの場合、パスの通った部分に配置する必要があるようです。
本体のVoiceBar.dllも
regsvr32 VoiceBar.dll
とする必要もあり、管理者権限だとややこしいのでインストーラにしました。
なんとなく不安定な部分もあるかもしれませんが、便利に使っています。
Vista/7はflac変換からの変換完了イベントを捉えられないことがあるようです。(TT)

Ver0.13)
 リターンキーを受け取るのと、音声のタイムアウト検出を追加しました。
Ver0.14)
 予測変換を実装しました。

それやこれやでアプリ版を似たように修正しました。使ってみるとこの方が良いような気もします。(^^!
マウスでの登録検索キーワード追加もよかったりします。IE版はセキュリティで難しいように思い割愛しています。
場所もツールバーすら要らないのがいいです。

by   at 09:00  | Permalink  | Comments (0)

GoogleApiKit

PCに於けるGoogle音声認識の利用の一環ですが、これは開発者向けです。

本Kitは、GoogleAPIKitはGoogleのWebAPIWindowsで簡単に実現するためのdll集です。
Com型のdllですので、従来のVC,VBやBCB,Delphi、.NETでも使うことができます。
2014.05:Google音声認識APIでV1が打ち切られたためV2に変更。

■ダウンロード(Ver0.14)
GoogleApiKit(Zip版ダウンロード)
1.概要
 GoogleAPIをアプリから簡単に使うためのdllのセットです。

2.特徴
 Googleとは、どれも文字列やファイルで通信しますが、dllによって煩雑なコードを書かなくても数行の記述で使用できるようになっています。
現在は次の4種があります。
1)検索
GoogleSearch.dll
2)音声認識
SpeechDialog.dll
3)予測変換
GoogleSuggest.dll
4)音声合成
GoogleTTS.dll
(TTSは認証が必要になったため現状は動作しません。表示画像のコードが必要になりました。理由は以下のようです。)
お使いのコンピュータ ネットワークから通常と異なるトラフィックが検出されました。
このページは、リクエストがロボットではなく実際のユーザーによって送信されたことを確かめるものです。

3.使い方
それぞれのフォルダの説明書を読んでください。

4.サンプル
C#.net,BCB,Delphiのサンプルを同梱しています。(実行ファイルもあります)

5.ライセンスなど
同梱の中に次のものが含まれています。
2)音声認識
SpeechDialog.dll
・flac.exe
これは
http://flac.sourceforge.net/
で公開されているコマンドラインソフトです。
改変はしていませんが、BSDライセンスになります。
「再配布する際に著作権表示を行うことのみを条件とする」
ためここに表記いたします。
4)音声合成
GoogleTTS.dll
cmdmp3.exe
これはjimlawlessのオープンソースのものですが、特にライセンスの規定記述はありま
せんでした。
改版はしていませんが再配布になりますので著作権表示しておきます。
といたします。

6.その他
■本Kitについて
基本的にはFreeWareで組み込みの場合の再配布も自由です。
ライセンスはBSD相当として
「再配布する際に著作権表示を行うことのみを条件とする」
といたします。
尚、商用に組み込みも可能ですが、その場合はご連絡いただけるようお願いいたします。

【独り言】
SpeechDialog.dllはflac.exeを呼ぶものですが、IEなどに組み込む場合はdllにしないとIE9では通用しないようです。
ただここではアプリ開発用として公開します。
flacのdll化は後日チャレンジしてみます。

by   at 13:46  | Permalink  | Comments (9)

VoiceBar

PCに於けるGoogle音声認識の利用の一環で、そういうソフトを作成してみました。
アプリですが、その後改版しIEのタイトルバーに張り付きますしIEがない場合に起動もします。
IEとは別物ですのでIEの速度も下げず安定性を下げることもないし、場所もタイトルバーなので面積を占有せず、考えようによってはこの方がいいかもしれません。
注)201405:Google音声認識APIでV1が打ち切られたためV2に変更。

■スクリーン

■ダウンロード(Ver0.17)
Zip版ダウンロード

1.概要
 VoiceBarはWindowsでGoogleの音声認識・検索機能を利用するためのツールです。
単独アプリケーションとして動作します。

2.特徴
・IEのタイトルバーに重なるので場所をとりません。
・WindowsのアプリとしてGoogleの音声認識が使えます。
・ジャンルを指定した検索ができます。
・認識結果をクリップボードに転送できます
・クリップボードに入れた場合、その語句で検索ができます
・検索テキストで予測変換をかけました。

3.インストール/アンインストール
 適当なフォルダに展開しRunVoiceBar.exeを起動すれば動きます。
 レジストリは使用していませんので、そのままフォルダ毎消せば消えます。

4.動作説明
RunVoiceBar.exeを起動してください。
(RunVoiceBar.exeでもかまいませんが、Vista/7の場合、設定によってはうまく表示でき
ない場合があります。)
RunVoiceBar.exeは起動したらRunVoiceBar.exeを立ち上げ自動的に終了します。
IEを選択するとバーが出現します。(右クリックで単独終了も可能にしました。)

動作内容)
起動したときにIEがなければIEを立ち上げます。
IEがある場合でアクティブな場合、姿を現します。(アクティブでないと消えています)
IEを(全部)終了させると自動的に終了します。

・マイクアイコン
 これを押すと音声認識が起動します。
 Googleの音声認識になります。
・検索用テキスト
 音声認識が終わるとここに出力されます。
 キーボードでも入力できます。
・検索種類
 検索するサイトの種類が選択できます。
「一般」「地図」「ニュース」「画像」「動画」「YouTube」「Amazon」から選択が可能です。
・検索ボタン
 「テキスト」「種類」から検索します。結果は別のタブで開きます。
・Copy
 検索テキスト(=音声認識結果)の内容をクリップボードにCopyします。
 これは例えば入力部分で音声入力を使いたい場合に発声・認識後、Copyすれば、入力部分に貼り付けて使うことができます。
・その他
 クリップボードを監視しており、クリップボードにテキストが入ると検索窓に入ります。このことで通常のアプリ(メールなど)の語句も検索できます。

5.ライセンスなど
・flac.exe

http://flac.sourceforge.net/
で公開されているコマンドラインソフトです。
改変はしていませんが、BSDライセンスになります。
「再配布する際に著作権表示を行うことのみを条件とする」
ためここに表記いたします。

【独り言】
・IEのツールバー用のものを作成していたのですが、IE9からだと思いますが、子プロセスが実行できないようです。
 そのためflac変換が動きません。XPはIE8なので動くようです。
 多分、wav->flac変換など、最低でもdllで呼べば動作するのではないかと思いますが、対応には時間がかかりそうです。
 flacというのはなかなか作成方法がわかりませんが、LibFlacを使うとできるようで、実はやってみましたが、不安定で改良が必要なようです。(TT)
 IEのツールバーなので子プロセスでexeを禁止したい気持ちもわかならいではないです。ただ作成的にはdllですが、親がIEのアプリの一種のような感じです。

 「ツールバー」はブラウザなのかアプリなのか?
 このあたりがセキュリティとのジレンマだと思います。

追記)
そちらはできましたが、不安定さもありますし、こうやっても同じ感じです。
ただ、Vista/7は最初にIEを起動するとうまく描画できません。もう1度やると再描画するようです。しょうがないのでRunVoiceBar.exeを作りました。これで動きます。(^^v

さらに使っていくと...
・ボタンの場所が悪い(マウスストロークが長い)
・リタンキーで検索しない
などの細かい点が気になり修正。
Siriやしゃべってコンシェルを目論んだが、考えるとPCにはPCらしいやり方もありそうだ。
思ったのは検索には慣用句を多用する。例えば場所で「金沢」など。
「お花見」「金沢」でも通じるし、「時刻表」「金沢」、「天気」「金沢」、「レストラン」「金沢」などでも通じる。
なのでこういう自分なりの慣用句を登録しておいてそれをマウスで選択するようにした。
元々音声結果を入れていた部分が引き出し風になっていたのでそこを利用した。
やってみると、案外よくて簡単なキーとマウスだけでも結構サーチできたりする。
Ver0.14で修正しておいた。
さらに使ってもらうと予測変換を多用するとのこと。
Ver0.15で修正しておいた。
さらにデフォルトブラウザがIEでない場合そちらで開く。
Ver0.16で修正しておいた。

by   at 13:30  | Permalink  | Comments (5)

PCに於けるGoogle音声認識の利用

とあることで、元金沢大学の船田先生とお知り合いになった。
で、これまた先生から原稿と発表を依頼された。
でタイトルが「PCに於けるGoogle音声認識の利用」。

3月11日の第4回音響・超音波ジョイント研究会(北陸支部)で発表を行った。
これが同日の資料
「PCに於けるGoogle音声認識の利用」
自分で書いたので公開は差し支えないだろう。
共同執筆の船田先生には感謝。m(__)m

内容はくだけて書くと
・音声認識はMSの添付で失望してきた
・AmiVoiceは感動ものだが、ヘッドセット以外がうまくない
・そこへGoogle音声認識が登場したがスマホ中心
・PCでもChromeでできるようになったがいろいろ不便
*但し、以下を入れると入力部分に音声が通用する
Speakable Textareas
http://userscripts.org/scripts/show/108011
・Chromeに頼らずWindowsのアプリを開発する方法の説明
(音声をサーバに投げて結果をもらう)

スマホがどんどん便利になるのにPCは遅れをとっているような。
音声認識はSiriやしゃべってコンシェルなどのエージェント風に発展してきている。
PCはキーボード中心とは言っても便利な場合もあるのだが...。

by   at 13:08  | Permalink  | Comments (0)