開発ブログ

ページメニュー

<< たべたいjp正式オープン! | main | ドメインを変更しました >>

カレンダー

<< May 2017 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 >>

  • ギャル文字や2ちゃんねる用語にも対応の入力フィルタを開発中
  • ユーザが入力した文章が妥当な文章であるかを解析判断する入力フィルタをつくってみました。ギャル文字や2ちゃんねる用語にも対応しています。

    入力フィルタリングテスト
    ※開発途上のものなので、至らぬ点があるのはご容赦いただきたいです。。
    不穏当な言葉のフィルタリングテストなので、それはそれは不穏当な言葉がたくさん並んでいます。予めご了承ください。

    分類不可な否定表現や性的な表現、誹謗中傷的な表現を伴うと判断された場合は入力ができなくなるような仕組み。文章解析の仕掛けは以下のような感じです。

    • 入力された特殊な文字列を変換し、通常文字に戻す(ギャル字逆変換、小文字から大文字、カタカナからひらがな、2ちゃん用語対策)
    • 文字を要素形態で区切る
    • それぞれの要素に近い文字があるかを確認(*とか○といった伏字対策)
    • 語句の連動性を確認

    不特定多数の衆人の目に触れるWebサイトに記事を書く際に、問題の火種となるような発言をサイト側でフィルタさせるのは、水際対策としては非常に有効。
    そのための入力規制、及び入力妥当性のチェックをしっかり行うべきなんだけれど、これが本当に難しい。
    「学校裏サイト」など、多くの問題あるサイトで使われている掲示板は、禁止語句の設定が無い、もしくは弱い場合がほとんど。
    誹謗中傷によるサイトの「炎上」や、それによる経済的社会的損失を未然に防ぐためにも、高性能な文章解析フィルタの必要性は高いのではないかと思うのです。

    随時開発を続けていきますので、興味のある方はいろいろいじってみてください。

| 開発関連 | 17:11 | comments(0) | trackbacks(0) |


コメント

コメントする

この記事のトラックバックURL

http://blog.24th.jp/trackback/864153