Exploratory アワー #771 - AI 関数を使って日本語の文章をJTF標準に従って改善する

日本語の文章を使用する際、表記の揺れや全角・半角の混在は読みやすさを損なう大きな要因となります。特に、日本翻訳連盟(JTF)が公開している「日本語標準スタイルガイド」のような厳格なルールに従って文章を修正する場合、従来は手作業や複雑なテキスト加工が必要でした。

今回は、ExploratoryのAI 関数を活用し、JTF標準のルールをプロンプトとして与えることで、大量のテキストデータを自動的に一括修正し、品質を統一する手順を紹介します。

問題

ホテルレビューなどの自由記述データには、全角数字と半角数字の混在、記号の誤用、アルファベットの表記揺れ(全角・半角)が多く見られます。これらを分析やレポートに使用する場合、手動で修正するには膨大な時間がかかり、またルールを自分で定義してテキスト加工を行うのも設定が複雑になるという課題があります。

解決方法

AI関数による文章改善の準備

今回使用するデータは、1行が1つの回答に対応するホテルレビューのデータです。

このデータには「5回」や「3組」といった全角数字が含まれていたり、アルファベットが全角で入力されていたりと、表記が統一されていません。

AI関数の作成メニューから「自分で作成」を選択します。

プロンプトには、JTF(日本翻訳連盟)の標準スタイルガイドからコピーしたルールを記述します。

以下のルールに従って文章を改善してください。

1. 本文を、敬体(ですます調)あるいは常体(である調)のどちらかに統一する。
2.句読点は「、」と「。」を使う。
3.常用漢字表にある漢字を主に使用する。
4.動詞の送りがなは本則に従う。
5.カタカナ語の語尾の長音は省略しない。
6.長いカタカナ複合語は中黒または半角スペースで区切る。
7.漢字、ひらがな、カタカナは全角で表記する。
8.数字とアルファベットは半角で表記する。
9.原則として記号類は全角で表記する。
10.半角文字と全角文字の間に半角スペースを入れない。
11.ピリオド(.)、カンマ(,)、スペースは半角で表記する。
12.単位の表記を統一する。

実行すると、AIが各行の文章に対して、プロンプトで与えられたJTF標準ルールに照らし合わせて修正を行います。例えば、全角で入力されていた「3組」という表記は、自動的に半角の「3組」へと統一されます。

これにより、バラバラだったレビュー文が、JTFの標準スタイルに準拠した読みやすい文章へと一括で変換されます。社内独自のライティングルールがある場合でも、そのルールをプロンプトに差し替えるだけで、同様の自動改善を簡単に行うことができます。

ビデオ

Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio