WinでSiriもどき
WinでGoogleの音声認識っていうかIEで音声検索っていうのは一応完成した。
使っているといろいろ修正したくなって今朝も修正していた。
目標は高く、Siriを目指す!!(しゃべってコンシェルか)
と思ったのはいいが...。
だいたい、本来ならMSがApple(やDocomo)に先駆けてやっても良さそうなものだが、音声認識も内蔵のものはいまいちで使い物にならない。
GoogleはAndroid用のものをやるかもしれないがDocomoがやったので、手出ししないのかも。
音声認識もChromeがある。IE対応もやればできるだろうし、Googleツールバーに入れれば良さそうなものだが、HTML5のパーサ部分がIE内部だろうから無理があってこういう感じのものは作らないような気がする。
MSはと言えば肝心のOSもVistaこの方こけまくりで、UIなどから言えばXPの完成度の方が高かったような気がする。7はVistaをXPよりにしただけのような。
それより何より最初はあった「夢」がまるでなくなってきた。Win8もなんだか「後追い」でPhone7と合体したような感じだし。
さっさと引退したゲイツと現役で最後まで頑張ったジョブスの違いかしら?
それはともかく、能力的に高いPCがスマホに負けるってのは...。
最近はWebAPIでネットワーク前提なので、本体の処理はさほどでもない。認識もサーバだ。だからスマホでもWinよりも良い環境ができたりする。
ただ逆にWinでもスマホの環境はできるはずなのだが、意地なのかなかなかそうならない。PCのものがスマホになる時代からスマホのものがPCに移植される時代なのか。
音声認識そのものは、スマホのようなキーボードが邪魔な端末のためのものであるが、PCだって簡単に入力できるわけで、あった方がいいに決まっている。
MSに期待してても出来ないものはできないし、そういうビジョンも見せてくれなくなった。なのでSiriの自作という話になる。
通常なら自作なんてできるわけがないが、音声認識だって移植できるわけで。
Siriであるが、多分、会話を検索語句に変換すればいいのではないかと思ったりする。
スケージューラとかアラームとかメールとかいろいろあるにはあるが、まずは検索だろう。
それで人工無能っていうかを調べてみるが、考えるとその前に形態要素解析をやったほうが良さそうだ。
でそれも辞書があっていろいろ面倒だがYahooでできたりする。
http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html
こういうのを利用できるのは本当に有難い。
で、例えば
「カレーが食べたい」
というと名詞と動詞を抜き出して
「カレー(名詞)」「食べ(動詞)」が出てくる。
そこで動詞の「食べ」をレストランに置換する。
でレストランなので「場所」を付加する。場所はGPSがあればその地点をとるのだろうが、ここはPCは(GPSもないし)最初に登録させておいて例えば「金沢」とする。すると
「カレーが食べたい」
は
「カレー レストラン 金沢」
に置換される。検索するとそれらしく出る。
「カレーが作りたい」
は「作り」を「レシピ」に置き換えて付与するものはなしにする。
「カレー レシピ」に変換して検索する。
そういう簡単な動詞の変換辞書を作れば案外行くんじゃないかと。
応答をTTSで欲しい場合は...マルコフ連鎖かな?(^^!
何はともあれ、そもそも自分はどんな言葉で検索しているか?を幾つか書いてみた。
で、書いて見ると結局はそんなに多くの言葉を使っていないような気がしてきた。(^^!
多くの場合新しい語句と次のようなものの組み合わせで検索しているような。
他にも「中古」とか「オークション」とか、趣味も個人によってはいろいろあると思う。そこらは自分で登録するとする。
<場所>石川県
<場所>金沢市
<場所>金沢駅
<日付>明日
<天気>天気
<天気>気温
<場所>地図
<交通>時刻表
<交通>乗換
<交通>アクセス
<手段>レシピ
<手段>作り方
<説明>Wiki
<説明>とは?
<施設>レストラン
<施設>ショップ
<施設>ショッピング
<施設>温泉 銭湯
<目的>観光
<目的>食事
<目的>グルメ
<情報>イベント
<情報>催し
<衣類>ファッション
<食事>和食
<食事>洋食
<食事>中華
<食事>イタリアン
<食事>ラーメン
<趣味>プログラム
<趣味>工作
<趣味>園芸
<価格>価格
<価格>低価格
で思ったのは「1語か2語だけを発音し」「後は選ぶ」という。
後者は認識もないし確実だ。
例えば「液晶テレビ」のみを発音。->「液晶テレビ」「低価格」で検索。
「お花見」のみ発音->「お花見」「石川県」で検索。
今日の天気などはマウスだけで検索できる。
で早速作ってみた。(VoiceBarApp版に入れてみた)
まあSiriのような感じではないが、検索に限って言うならこの方が使いやすい。
付帯的な語句は選択なので認識しなくてもいいので、結構検索効率も良かったりする。
要は「普段行うちょっとした検索」であれば「自分の慣用句」があったほうが遥かに効率が良さそうだ。
コメントはありません