2023年1月に、「ロシアのGoogle」と呼ばれることもあるロシア最大の検索エンジン「Yandex」からソースコードが流出しました。このコードの解析により、Yandexは「ハゲ頭」や「うそつき」といった罵倒語で検索した際に、ウラジーミル・プーチン大統領の画像が表示されないようにしたり、「Z」で検索してもナチス・ドイツに関する検索結果などが表示されないようにしていたことが分かったことが報じられています。

Yandexからのソースコード流出は、ハッキングなどの攻撃ではなく、政治的動機を持つ元Yandex従業員がGitリポジトリを盗み出して公開したことにより発生しました。

Yandexから流出したファイルは合計44.7GBに上るので解析には時間を要しますが、現段階でもYandexやYandexと人的交流が活発なGoogleの検索エンジンについて多くの知見が得られています。

例えば、SEO関連ニュースなどを扱うSearch Engine Landの解析によると、当初1922あるとされていたランキング要素はごく一部に過ぎず、実際には1万7854ものランキング要素があったとのこと。その中には「NEWS_AGENCY_RATING」という、Yandexが特定の報道機関を有利にするために使われているとおぼしき変数もありました。

この発見についてSearch Engine Landは「このようなバイアスをランキングシステムに導入しないことを断固として表明してきたGoogleとは大きく異なる点です」と述べています。

続きはリンク先
https://gigazine.net/news/20230201-yandex-scraping-google-seo-code/