今週の悩み:動詞の活用処理
今週のできごと
今週も平日はとりたてて何もなし。テレワーク4日、出社1日というペースで仕事をし、夜は読書、合間にスマフォゲーム(FGO)という日々でした。
週末も特にイベントは無く家で過ごしました。
土曜日は、読み終わった本の読書メモを書く気分になり、その作成で一日終わってしまいました。普段、趣味で読む本は読んだらそのまま感想を読書メーターやブログに書くくらいなので、気になった文章を抜書きするような読書メモを作ったのは初めてです。
「詩を作るプログラム」について
プログラムの構成案
日曜日は、週末プロジェクトの次テーマ「詩を作るプログラム」に取り組みました。ですが、土曜日に真面目に頑張りすぎたせいか、ほとんど進みませんでした。
一応、平日につらつら考えたことを整理して、「こんなものになるのではないか」というプログラムの構成案を下記の図に書いてみました。
現時点の悩み:動詞の活用処理
現在、どう処理しようか悩んでいるのが、動詞の処理です。
辞書に登録した語句を適当に選んで、それっぽい形で並べれば詩みたいに見えるんじゃない?という、非常に意識の低いことを考えているのが「詩を作るプログラム」です。
しかし、そう言っても、最低限の日本語文法に沿った語句を使わないとあまりに不自然でしょう。そこで今悩んでいるのが、動詞の活用の取扱いです。
世の中にある生テキストをMeCabの機能でわかち書きし、品詞や拍数(モーラ数)などのメタデータを付加して語句データベース(辞書)として保存する、ということを考えています。この際、活用形となった動詞が他の動詞や助詞・助動詞と結合している動詞句(日本語の文法にはない言葉ですが便宜上こう呼びます)については、生テキストの形のままで保存してそのまま詩生成に使用するか、品詞に分解して保存し詩生成時に他の語と組み合わせて動詞句にするか、やり方はいろいろあると思います。とりあえず、どのよやり方を採用するべきか、またそれをどうやって実現するか、はっきりした筋道が見えずスタックしています。とりあえず、動詞句の構成をもう少し頭に入れないとアイデアも出ないので、MeCabであれこれのテキストを分解して見比べているところです。
週末プロジェクトの記録
人工無脳の設計
- 「元気が出る会話」とは何か決める
- 「元気が出る会話」のパターン(その2) - 週末文書で会話のタイプを分類分けし通り、当面開発の対象とするのは以下2タイプです。
- とにかく肯定的なあいづちを返すタイプ
- 何かしら気晴らしを提供するタイプ
- 人工無脳の実装方式を決める
- 「詩を作るプログラム」大雑把な構成を考えました。
人工無脳の開発
- プログラミング環境を整える
- 今週は特に新しい追加はしませんでした。
- プログラミングを学ぶ
- Pythonプログラミング一般:Python公式HPのPython チュートリアル — Python 3.9.4 ドキュメントを読んでいます。今週は「9. クラス」をポツポツと途中まで読みました。
- プログラムを設計・開発する
- 「詩を作るプログラム」での動詞の取扱いに悩んでいます。