hubotで日本語の読みがなを解析する(gooラボのひらがな化API編)

gooラボひらがな化APIを利用して、hubotで日本語の読みがなを取得してみました。

gooラボのAPI利用登録

gooラボのAPIを使うためには、gooラボAPI利用登録ページにてGitHubアカウントでの登録が必要です。

登録するとAPIを利用するためのアプリケーションIDが取得できるので控えておきましょう。

簡単でいいですね。

とりあえず使ってみる

ひらがな化APIは以下の仕様に従ってPOSTで利用します。
(参考:ひらがな化API

リクエスト先URL

https://labs.goo.ne.jp/api/hiragana

リクエストパラメータ

パラメータ名 説明
app_id アプリケーションID (必須項目)
request_id リクエストID (省略化)
sentence 解析対象テキスト (必須項目)
output_type 出力種別 (必須項目)
hiragana か katakana を指定

コマンドラインでテスト

hubotに機能実装する前に、curlコマンドで試してみます。
アプリケーションIDには各自で取得したIDを指定してください。

うまく動きました。

hubotから使えるようにする

hubotに対して以下のコマンドで、ひらがな、カタカナでの読みを答えるようにしてみます。

curlコマンドでテストしたときの要領でhubot-scriptを実装します。
アプリケーションIDは環境変数GOOLAB_APP_IDから読み込むようにします。

hubotのスクリプトとして実装したものをGitHubのknjcode/hubot-hiraganize-gooにおいてあります。

hubotへの導入

hubotへの導入は以下のとおりです。

npmからインストール

external-scripts.jsonへスクリプトを登録

動作確認

slackのhubotにスクリプトを組み込んで試してみると、

screen-shot

うまく動きました。

おわりに

検索エンジンを運営しているノウハウもあるのか、gooラボのひらがな化APIの変換精度は高いように思います。
稀に、応答が遅かったりしますが、無料で実用的なAPIを公開してくれているのはありがたいです。

ひらがな化APIのほかに、形態素解析や固有表現抽出や語句類似度算出などもあるようなので、時間があれば試してみたいと思います。

シェアする

  • このエントリーをはてなブックマークに追加

フォローする