Chinese (Simplified)Chinese (Traditional)EnglishJapaneseKorean

Peanuts Blog[かぎや盛岡べん別館]

コロナ禍は厳しい…その時々の気づきを書き綴ります。55歳過ぎての、定年前のシルバー起業。 このままでは楽しくないと… 横浜市の支援と信用保証、銀行融資を活用して、必要な国家資格などを取得。生業としてこれからの働き方改革を自分自身に適用しました。

WEGLOTで余計な翻訳をチェックする

目次

Weglotの全貌が徐々に解る

WEGLOT自動翻訳システムを入れて、1ヶ月近くが経ったが、その翻訳の全貌が徐々に分かってきた。

なぜこんなにどんどんとカウントが増えるのか。

下のページにある部分をクリックすると、翻訳したWordの詳細が出てくる。

f:id:SnackRed:20210614202714p:plain

不要なものも翻訳してカウントアップ

これを削除すると、どーんと数千WORDカウントが減った。

特にどこから現れたか不明な内容がくせ者。至る所に出てくる。

🪀❤️️Süße Blondine Amüsiert Sich Mit Zwei Jungs🪀❤️️Www.MtSp.XyZ🪀❤️️Süße Blondine Amüsiert Sich Mit Zwei Jungs Süße Blondine Amüsiert Sich Mit Zwei Jungs Süße Blondine Amüsiert Sich Mit Zwei Jungs

Google検索でみると出てくる出てくる。

有名サイトのにも出てくる。どこに組み込まれているのか現在調査中です。

f:id:SnackRed:20210614203256p:plain

調査中その後。サイト内検索ウィジェットをねらった検索攻撃

Wordpressで作成したHPへのサイト内検索に対するロボットが走っている様子がうかがえる。

サイト内検索にSearchコマンドを投げているのか、その履歴が残っている。その履歴をも翻訳しているように見える。

出てくるキーワードは、ロシアなどのエロチックサイトに誘導されている。

したがって、「サイト内検索ウィジェット」を削除して様子を見ることとする。

f:id:SnackRed:20210709202505p:plain

サーバーキャッシュも一度削除して、数日様子を見たがまだまだ狙ってきている。
ログが「Translations by languages」詳細ログに残っている。1バイトでも1WORDカウントされるため、頭が痛い。

ロシアのエロサイトなどキーワードは変わらない。

 

Wordpress「サイト内検索ウィジェット」を削除して2週間経ったが........

キャッシュも含めて翻訳されるのかと考えて2週間程度経ちましたが、依然として検索結果ログが残ってしまう。

推測するに「404ページが見つかりませんでした」の検索結果ページを見ると、このページがしっかりと残ってします。これを翻訳してしまうのではないかと。

f:id:SnackRed:20210709201552p:plain

この404エラーページが表示されないように、HPへすべてリダイレクトさせてしまうプラグインを導入した。

f:id:SnackRed:20210709201708p:plain

設定は非常に簡単です。さて、これでどうなるだろうか。

[解決…たぶん]ドメイン検索コマンドのスパム対応(2021/08/14追記)

外部からドメインに直接送られてくる検索コマンド「ドメイン名/?s=◯◯」。◯◯にロシアのエロサイト内容が記述されている。これを無効にして404へ飛ばすコードが紹介されている。

サイト内検索機能を悪用したスパム攻撃を受けたので対応について | MASAa.net

これを適用して様子を見るとする。そうしないと、毎日無駄なカウントアップをしないように、WeglotのTranslationを削除しなきゃならないからだ。

 

 

重複する翻訳WORDカウントを排除する

WEGLOTの取説は何処をみても現れてこない。「Glossary」の使い方や「Translation」ページ翻訳された内容のチェックなどだ。特に注意したいのは、長文翻訳が重複して行われてカウントされている点である。

しかも、それを削除してもまた表示される。このサービスに懐疑心をいだいた瞬間である。

全ページをチェックすることは必要だ。ダブルで翻訳された内容が表示されるが、どちらを削除しても構わない。カウント減らすことだ。数千WORDは減ることがある。

チェックボックスをチェックして⇒レビューするアイテム候補を選択し⇒「Mark as reviewed」をクリックする。

「Automatic Translation」表示が「manually edited translation」に変更される。

これでほとんどの重複翻訳がされるが、その仕組みは調査中である。

また、「review」がなされ、「manually editted translation saved」になれば、少し時間がかかるが数分後には、重複翻訳されたところがなくなるようだ。

f:id:SnackRed:20210615211904j:plain

再度、全ページをチェックして翻訳されたWORD数を確認すると、数千ほど少なくなっているのが分かる。

 下記の図は、92,000カウント程度だったのが、89,000カウントまで減った。

また、「Manually Reviewed words」が100%となっている。最初は何のことだか分からなかったが、100%になるようにレビューすると言うことらしい。

f:id:SnackRed:20210615212221p:plain

調査中その後。重複について分かったこと。

ブログ投稿記事とお知らせ記事には、各々①TOPページに記事のリストと要約が記載されている。同様に、②各一覧のページにも記載されており、③本文記載ページと3カ所に渡る。

したがって、重複した翻訳がURLが異なり、WORDカウントされているという構造だと理解した。

全文大文字翻訳になっているパラグラフ

これは、よく分からない。調査中である。

いつカウンターがリセットされるのか

カウントの事が気になるが、一体いつカウントがリセットされるのか?

毎月1日にリセットされると何処かに記述されていたと思うが、契約が1ヶ月以上過ぎているが、まだリセットされない。

本日を起点として、最初の契約をしたのが30日前、その後29日前(「StartUp」契約翌日)に「Business」へ変更し、6月2日に「PRO」へ変更した。

あっと言う間にカウントアップしてしまったのだ。

最初の契約から30日が経過した時点では、まだリセットされないと事実が分かった。

ちょっとした、ブログ追加更新があると数千WORD程度増えてしまう。イイの変わるのか分からない。(年間契約やめれば良かったかなと後悔)

「Weglot」か「ConveyThis」か?

まずは、Google翻訳エンジンのものは、選択肢から外しました。Personalブログであれば、freeプラグインで問題ないでしょう。

今回は、業としての事業用サイトであるためです。

それぞれのサイトは、

https://weglot.com/

https://www.conveythis.com/ja/free-translation-plugin-for-wordpress/

本当は、DeepLがプラグインであればいいのだが、投稿編集画面にボタンを設置した管理画面用ツールとしてだけである。本サイト上での自動翻訳ではなさそうだ。

有料サービス料金

さて、どちらも有料サービスになるが、Weglot契約してから、ConveyThisを知った。

Weglotはフランス製(ユーロ建て契約)、ConveyThisはアメリカ製(米ドル建て契約)となる。つまり、円建ての為替が大きく関係してくる。為替情報を気にしながらの選択になるだろう。

使い勝手はどっちか良いのか「翻訳スイッチ」の設定

Weglotは自由度は高くない。テーマプラグインによるが、全体の画面バランスを考えながら、崩れないように設定が必要だった。

ConveyThisは、フロートで設定できるようだ。テーマには依らないし、自由度が高い。ユニークで面白いから方式だし、円高がしばらく続きそうなので、ConveyThisがいい感じです。

来年は、ConveyThisに契約変更するつもりだ。

ConveyThisのPoorな翻訳が!?

「Press」が原本なのだが、「押す」って正式サイトに記述されている。直さないようだ。

f:id:SnackRed:20210802215128p:plain