テキスト内の文字からアクセント(発音区別符号)´, `, ¨, ^などを削除します。é, ü, ñなどの文字をe, u, nに変換します。
発音区別符号は、発音を変えたり、類似の単語と区別したりするために文字に追加される記号です。例としては、アキュートアクセント(é)、グレイブアクセント(à)、ウムラウト(ü)、セディーユ(ç)、チルダ(ñ)などがあります。多くの言語で不可欠ですが、基本的なASCII文字のみをサポートするソフトウェアシステム、データベース、またはURLで問題を引き起こすことがあります。
このツールはUnicodeの正規化(特にNFD - 正規化形式正準分解)を使用して、基本文字とその発音区別符号を分離し、そして記号(Unicodeの範囲U+0300からU+036F)を削除します。これにより、アクセント付き文字を最も近いASCII相当に効果的に変換します。