概要
WOVN では、通常、翻訳対象として登録された Webサイトの HTML情報が自動的に抽出され、WOVN が管理するデータベースに格納されます。ここで発生する問題は、抽出すべきでないコンテンツがWebサイトに含まれている場合、それらの情報も WOVN に送信されてしまうことです。
これを避けるため、抽出すべきでないコンテンツに対して、翻訳抽出無視の設定を行います。
翻訳抽出無視箇所の選定・設定は、下記の観点で行います。
- 個人情報の流出対策:個人情報や企業機密といったデリケートな情報を WOVN 側に取得させない
(対象コンテンツの例:お申し込み・お問い合せフォームの入力内容確認画面、マイページ、カート、チャット、等) - 翻訳文字数の節約:翻訳不要な動的コンテンツを翻訳することによる機械翻訳文字数の浪費を防ぐ
(対象コンテンツの例: 時刻、在庫数、空席数、等)
翻訳抽出無視の設定方法
翻訳抽出無視を設定する方法は 2つあります。
- 抽出無視タグ(data-wovn-ignore属性)
-
抽出無視ルール設定
抽出無視タグ(data-wovn-ignore属性)を利用して設定する
抽出無視タグ(data-wovn-ignore属性)を HTMLタグに指定すると、そのタグの中身は WOVN によるスクレイピングの対象外となります。
インフォメーション
既にWOVNを導入済みのお客様は、引き続き「wovn-ignore 属性」を利用することが可能です。
抽出無視ルール設定を利用して設定する
抽出無視タグ(data-wovn-ignore属性)を直接挿入できない場合や対象箇所が多すぎる場合、4種類(タグ / クラス / 属性 / セレクタ)の指定を組み合わせて、抽出無視ルールを設定できます。
ルールが設定された HTML要素は、翻訳対象として抽出されません。
インフォメーション
HTMLタグによっては、設定をしなくても自動的に抽出無視となるものもあります。
詳細はWOVNがサポートしているHTMLタグを参照してください。