「自動コンテンツ取得機能」のエンドユーザーレポートがONの場合、スクレイプされたコンテンツは、レポートという処理によってWOVN.ioサーバーへ送信されます。
WOVN.ioサーバーで受け取ったコンテンツは、それぞれ新規コンテンツであるかを確認し、一旦データベースに保存された後に自動で機械翻訳が行われます。(「自動機械翻訳機能」がONの場合)
また、WOVN.io に未登録のページからレポート処理が行われた場合、WOVN.ioサーバーから該当URL へのサーバーサイドスクレイピングが実施され、静的コンテンツのみページに紐付け管理されます。*1
*1: 未登録のページを自動的にWOVN.ioに追加するには「ページ自動追加機能」設定を有効にする必要があります。
レポートの送信元と送信先
レポート処理はブラウザ(ページにアクセスしたユーザーの端末)から送信され、WOVN.ioサーバーへ送信されます。
そのため、利用している端末がWOVN.ioサーバーへアクセス出来ない場合、レポートは失敗します。
レポートが発生するタイミング
レポートは、下記条件が揃ったタイミングで実施されます
- Webサイトの元言語でアクセスしている
- 5秒以上ページを閲覧している
上記に加え、JavaScript、Ajax通信によって動的コンテンツが HTML 上に出力された場合も、レポートが再度実施されます。
そのため、ページを表示した時点では出力されていないHTMLコンテンツは、スクレイピングやレポートの対象になりません。
レポートされる内容
新規ページ、新規コンテンツの有無に関わらず、レポートはページ上の全コンテンツをすべて WOVN.io に送信されます。
ただし、data-wovn-ignoreやコンテンツ除外ルール設定を使った抽出無視対象のコンテンツは対象外です