三属性変換のハ万要素(接辞関係)、変換ハは最初接頭辞も接尾辞も両建てで漢字変換することを想定していたのですが、
早々に方針転換して接尾辞判定だけハ万で処理、接頭辞は前段に接頭辞部分でØマーカーをしてから後続をタイプ
という別系統の操作になりました。
接尾辞:(対象語全体をタイプ後そのチャンクに属性を後付けで決定)
接頭辞:接辞部分と語幹部分の逐次区切り目でØを明示的に挿入
うまく説明できないので具体例を出して比較すると
とうしせつ→三属性ハ万→接尾辞解釈→変換→投資説
とう→+Ø→+しせつ→通常変換→接頭辞解釈→当施設
のようになります。
接尾辞は最後までタイプしないとわからないのでチャンク完遂後に評価プロセスをつける(判定型)
接頭辞はのちのちまで引っ張るとノイズに埋もれてしまうのでチャンク逐次でリニアを切る(宣言型)
の生成スタイル自体が別種のものです。
今回はこの中で接頭辞のマーキングに使われる
Ø(ゼロ)文字マーカー
について語りたいと思います。
ペンタクラスタキーボードは助詞や機能辞の別口入力が既にありますので今更区切り目でわざわざキーを用意することもないだろう、という見方があるのは承知していますが
志高く、全チャンクの自明化を目指しておりますのでそれでもカバーできないあいまいな要素を回避するため予防的に手当てをしていきます。
・長尺の複合語・合成語の切れ目検出のため
・連用中止法の切れ目の判別のため
・接頭辞の切れ目の判別のため
・アジェンダ名詞(助詞抜き提題)の文頭チャンクの切れ目を判別するため
などにØ文字マーカーの区切りを使っていきます。
これを布くことにより日本語には分かち書きがない決定的な弱点を克服し、助詞別口入力との役割分担/補完関係
を念頭に置きながら清明な文法構造の記述に役立てていきたいという算段です。
今回は厳密な定義とか設計の骨子だとかを語るのは控えて、導入としてのカジュアルなトピックとして提示するために
あえて本筋的な話をするのは避けます。
半可通が定石をすっ飛ばしてまずはフックのある事柄に飛びつきやすい、
こういう現象を私は
「うぶちり」
と呼んでいますが、まだ自分自身も見解が固まっていないところもありますので無茶して完成形を出すのはあきらめて
お茶濁しかも知れませんが
「うぶちり」や「とっ散らかった視点」
をかいつまんで採り上げてみたいと思います。
☆うぶちり1 インビジブルセパレーター
不可視の区切り文字。表示時には幅がゼロなので見た目ではわからないメタ情報。
これはまだ未習熟なので使いどころがわからないが、あんまりメタ情報記述のためにわちゃつくとシステム一貫性を崩す例外要因になりがちだからあまりPシステムで採り入れるのは気が進まない。
肝心なのは表示上で分からなくても、チャンクのポインティング時などでポップアップや色違いキャレットとか方法は何でもいいけれどグラフィカルに識別できるようなアクセス性を確保することが大事だ。
☆うぶちり2 高級食材/恒久贖罪
接頭辞として宣言するときは単なる単語連結でなく接頭辞フラグを保持した上で適格候補を選別するプロセス。
ピント外れな変換を出さない構造上の工夫。
☆うぶちり3 文法逸脱的な接頭辞用法
開幕謎の寸劇
いつの間にか骨折
リアル北斗の拳
みたいな用法の構造。ちゃんと判定できるか。典型的接頭辞だけでない逸脱的ケアを広げるとしたら、その収録基準を決めるのが難しい。
☆うぶちり4 ウ大統領とか
ウ大統領
ド軍
ロ社
こんなのは初見だと絶対出せないから汎用的に識別できる手立てを用意しなくてはならない。
短いパーツなのでいちいちØを入れるとなるとちょっと入力が面倒くさい。
あるいは文化変換なのか?それだと造語・新語に対応できない。
☆うぶちり5 一体化している境界のわからない接辞要素(派生をカバーできない)
ノンシュガー ノンポリ ノンデリカシー
珍客 珍システム 珍CPU 珍八百屋
不格好 不細工 不調法
まあこれは適宜に判断するしかないよね。他にもいろんな接頭辞がありそう。
☆うぶちり6 和語の接頭辞
真サバ 稚アユ み心 生娘
か細い うち沈む ぶち壊す 素早い
和語は造語少なそうだから通常変換でやればいいか
☆うぶちり7 ラスボス「お」と「ご」
「お食べになります」「ご覧になります」文みたいなやつは、実質、名詞の成就文になっているから、三属性イ万で処理すればいいのでは
「お菓子」「おネギ」くらいなら問題ないが「お子」「おベンツ」さらには
「おインスタ」「おサイゼ」「おBingさん」「おジジイ」「おNHK」「お自民党」やっぱりマーキングするしかないか
「御」と「誤」の区別は厳密に:御は三属性イ万で、誤は用言だからはロ万で、どちらも接辞だからピボットはハ万兼任で、それぞれ守備範囲
☆うぶちり8 元号・頭語
元禄花見踊 寛永あしらい
元号は漢語で音韻紛れやすいからØ宣言で元号フラグ当てておいた方が解釈の助けになるのでは
「謹啓」「急啓」「再啓」「拝復」文頭での解釈に
☆うぶちり9 会計・金融特有の表現
含む信託勘定 除く信託勘定 除く臨時処理分
文法語かと思いきや、実質枕詞の接頭辞になっているからマーキングしたほうがいいかな
・・・以上、Ø文字マーカーの使いどころはこんなところです。