25
Booking.comの顧客は、Unicodeの難しさを身をもって知る
空自
(画像クレジット:Shutterstock)

フォントデザインの悪いと、「l」を「1」や「I」と間違えやすいです(笑)。幸いなことに、現代のフォントは、これらの混同しやすい英数字を区別するために様々な技術を採用しています。しかし、Booking.comユーザーを狙った最近のフィッシング攻撃が示すように、これらのフォントデザインは、異なる文字セット間の類似性から生じる曖昧さをほとんど考慮していません。

BleepingComputerは、「セキュリティ研究者JAMESWTが最初に発見したこの攻撃は、日本語のひらがな『ん』(Unicode U+3093)を悪用している。この文字は、一部のフォントではラテン文字の『/n』や『/~』によく似ている」と報告している。攻撃者は、人々がこの奇妙な文字を軽視し、悪意のあるリンクをクリックすることで、このキャンペーンで拡散されているマルウェアの餌食になることを狙っている。

Unicodeはこれまで何度もこのように悪用されてきました。例えば、スパムメール送信者がメールフィルターをすり抜けたり、あるいは悪意のある荒らしが、悪意のある言葉フィルターが普及しているにもかかわらず、オンラインで人々に嫌がらせをしたりするために、比較的よく使われる方法です。しかし、DNSと同様に、テキストレンダリングは多くの人が思っている以上に厄介な問題であるため、解決は依然として困難です。それでは、文字について簡単に解説しましょう。

コンピュータは当初、最小限の米国標準情報交換コード(American Standard Code for Information Interchange、いわゆるASCII)規格をサポートしていました。これは比較的シンプルで、コンピュータが英語アルファベット26文字(小文字と大文字の両方)、重要な句読点、そして改行やインデントなどのタイミングをコンピュータに指示する様々な制御コードを扱うことができました。

Unicodeコンソーシアムは、Unicodeは「最大約110万文字をエンコードできるため、世界中のすべての言語と文字体系を単一の普遍的な標準でサポートできる」と述べており、「すべての最新のオペレーティングシステム、コンピューティング環境、プログラミング言語、アプリケーションはUnicode標準の中核をサポートしている」としています。そのため、絵文字、句読点、英語以外の文字など、魅力的な文字を使用できるのです。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

ナサニエル・モットは、Tom's Hardware US のフリーランスのニュースおよび特集記事ライターであり、最新ニュース、セキュリティ、テクノロジー業界の最も面白い側面などを扱っています。