形態要素解析
しつこくSiriに近づける試みをしている。
多分、音声入力に対して
・適切な語句で検索する
・アプリをラウンチする
などがあるが、まずは「適切な検索語句に修正する」をやってみる。
入力は音声で、これはできている。
で、それを形態要素解析にかけた。
http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html
にあるようにやるとXMLで結果がかえる。
で、第一段階で文字を分解する
名詞=そのまま
動詞+助動詞で1語にする
形容詞=そのまま
...などとして他のものは外してしまう。
第二段階で、それを目的のものに変換する。これは自分で変換辞書を持つ。
例えば「食べたい」=「レストラン」にする。
第三段階で、その結果で「場所」などを付加する。
例えば「レストラン」=「レストラン 金沢」にする。
場所はスマホならGPSだがPCなので自分で入れることにする。
でやってみた。
■実験
上が入力で「しゃべり言葉」になり、変換に出ているのが「検索語句」になる。
なんとなくそれらしい。というかそれらしくなるように辞書を作っているというか。
後は辞書を頑張っていけばそれなりになるようにも思う。ただ...面倒だ。
そもそも自分で入力と辞書を書くと、できるようなパターンしか書かないのかも。
元に戻って形態要素解析=分かち書きとも言われるが、Yahooの形態要素解析が優秀な証明を1つ。
っていうかYahooのサンプルになってたりする。
こういう場合はどう検索するのかわからない...というか何をしたいのかわからなかったりする。
そういう「エラー」も通知すべきなのだろう。
とりあえず、ここらをdllにしておく。でもYahooの規約ではバナーを入れないといけないらしいがdllだと入らない。しょうがないので中にテキストを埋め込んでおく。
っていうか公表するかは未定。辞書がYahooにあるので、Mecabとかそういうのと違って軽いというか。
後は親切から言えばTTSで応答すればいいが、PCはオフィスにあるので「余計なお世話」なのかもしれない。
で、やってて思ったことだが...
しゃべる言葉->検索語句への変換
ってのは確かに便利といえばそうだが、逆に人間がやったほうが確実だし融通性がある。
学習から言えばキーボードを覚えるより遥かに簡単というか。
例えば
「カレーが食べたい」
はすぐに
「カレー」「レストラン」「金沢」
になるだろうし
「カレーを作りたい」
はすぐに
「カレー」「レシピ」
になる。
つまりはPCにやらせるより人間がやったほうがいいというか。
やってもたいしたことがないというか、そのほうがいいというか。
それやこれやでSiriへの意欲は大幅に減退してきたりする。(^^!
コメントはありません