Google ir uzņēmums, kas viena vai otra iemesla dēļ pastāvīgi paliek virsrakstos. Tie var būt gan labi, gan slikti iemesli. Uzņēmums radīja viļņus, noslēdzot darījumu ar Reddit, lai izmantotu savus datus, lai apmācītu savu AI. Šķiet, ka ērti Reddit rāda tikai Google meklēšanas rezultātus, nevis nevienu citu meklētājprogrammu. Šis varētu būt stāsts par attīstību, tāpēc laika gaitā var parādīties sīkāka informācija.
Šobrīd lielākie mediju uzņēmumi un publikācijas noslēdz darījumus, kas pārdos viņu datus AI uzņēmumiem. Piemēram, tādi uzņēmumi kā Axel Springer (pieder Business Insider), Vox Media (pieder The Verge) un News Corp (pieder vairāk nekā ducis publikāciju) ir noslēguši vairāku miljonu dolāru partnerības, kas ļaus OpenAI legāli apmācīt viņu datus. .
Pirms daudziem no šiem darījumiem Google noslēdza partnerību ar Reddit, kas ļauj meklēšanas gigantam piekļūt tā saturam un datiem. Tas ir žēl, jo mēs par to uzzinājām uzreiz pēc tam, kad uzzinājām, ka OpenAI skrāpēja tonnas datu no sociālo mediju vietnēm. Tātad šie lielie uzņēmumi noslēdza darījumus, kas AI sniegtu mūsu datus, mums nezinot.
Šķiet, ka Reddit bloķē meklētājprogrammas, bet ne Google
Google nav vienīgā meklētājprogramma šajā Misisipi pusē. Citas meklētājprogrammas jau gadiem ilgi ir sniegušas rezultātus, piemēram, Bing (Google lielākais konkurents), DuckDuckGo, Mojeek un Qwant. To ir simtiem, bet mēs lielākoties zinām tikai nedaudzus.
Šķiet, ka Reddit zina tikai vienu, un tas ir Google. Saskaņā ar jauno 404 Media ziņojumu, meklējot saturu, izmantojot vietni: reddit.com, jūs neredzēsit jaunākos rezultātus, ja neizmantojat Google. Šķiet, ka jūs neredzēsit nekādus rezultātus no pagājušās nedēļas. Tas attiecas tikai uz meklētājprogrammām, kas nepaļaujas uz Google indeksēšanu. Ja meklētājprogramma izmanto Google rāpuļprogrammas, tā parādīs rezultātus.
Lietotāji pieļauj, ka tas ir darījuma dēļ, ko abi uzņēmumi pārtrauca dažus mēnešus atpakaļ. Tas ir tik ērti, ka Reddit un Google pārtrauc satura darījumu, un pēkšņi visas meklētājprogrammas, kas nav Google meklētājprogrammas, nevar piekļūt jaunākajam Reddit saturam. Tomēr tas vēl nav apstiprināts.
Rāpuļprogrammas
Lai gan nav pierādījumu, ka Reddit darījuma dēļ bloķē citas meklētājprogrammas, tas būtu loģiski. Daļa AI tehnoloģiju ir saistīta ar tā sauktajām “rāpuļprogrammām”. Rāpuļprogrammas “pārmeklē” tīmekļa vietnes un iegūst no tām svarīgu informāciju. Ja jums ir vietne, tajā vienmēr ir dažādu uzņēmumu rāpuļprogrammas. Tas ir svarīgi, jo šādi meklētājprogrammas indeksē jūsu vietni. Tas ir veids, kā viņi ievieto jūsu vietni meklēšanas rezultātos. Tātad, lai jūsu vietne tiktu rādīta Google meklēšanas rezultātos, jūsu vietne ir jāpārmeklē Googlebot, Google rāpuļprogrammai.
Rāpuļprogrammas ir arī bēdīgi slavenas, jo AI uzņēmumi tos izmanto, lai iegūtu datus, lai apmācītu savus modeļus. Ir veids, kā apkarot rāpuļprogrammas. Vietņu izstrādātāji var izmantot failu “Robots.txt”. Šis ir fails, kas liek viņiem neindeksēt šīs vietnes datus. Tomēr šie faili var arī noteikt izņēmumus noteiktām rāpuļprogrammām, ļaujot tām pārmeklēt vietni, nevis citas.
Tā kā Reddit ļauj Google izmantot savus datus, pastāv iespēja, ka tas tikai ļauj Google tos pārmeklēt, tāpēc tikai tas var piekļūt saviem datiem, lai apmācītu Dvīņus. Tomēr, tā kā citi uzņēmumi nevar to pārmeklēt, lai apmācītu savus modeļus, tie arī nevar indeksēt Reddit un parādīt meklēšanas rezultātus. Tās ir tikai spekulācijas.
Mojeek izpilddirektora situācija
Saskaņā ar 404 Media, Mojeek izpilddirektors Kolins Heihersts pastāstīja par savu pieredzi šajā jautājumā. Uzņēmums saprata, ka Reddit bloķē Mojeek rāpuļprogrammu indeksēt vietni.
Sliktāku situāciju padara fakts, ka Reddit nav atbildējis uz viņa e-pastiem. Ir pagājuši gandrīz divi mēneši, kopš viņš nosūtīja e-pastu uz sociālo mediju vietni. Viņš sarunā 404 Media sacīja, ka Reddit ir “meklēšanai nogalinot visu, izņemot Google”.
“Mums tas nekad agrāk nav noticis,” viņš turpināja. “Tā kā tas notiek ar mums, mēs tiekam bloķēti, parasti nezināšanas vai stulbuma vai kāda cita dēļ, un, sazinoties ar vietni, jūs noteikti varat to atrisināt, taču mēs nekad iepriekš neesam saņēmuši atbildi no neviena.”.
Tas, iespējams, ir visneapmierinošākā šī pārbaudījuma daļa. Hayhurst ir mēģinājis atrisināt problēmu vairāk nekā mēnesi bez progresa. Mēs neesam pārliecināti, vai arī citas meklētājprogrammas saskaras ar tām pašām problēmām, ar kurām viņš saskaras.
Reddit apgalvo, ka nav neķītrās spēles
Reddit ir klusējis Haihurstai, bet ne visiem pārējiem. Uz apsūdzībām atbildēja uzņēmuma pārstāvis.
“Tas nebūt nav saistīts ar mūsu neseno sadarbību ar Google. Nav pareizi teikt, ka jaunākie Reddit rezultāti neparādās meklētājprogrammās, kas nav Google meklētājprogrammas, jo mūsu nesenais darījums ar Google,” 404 Media sacīja pārstāvis Tims Ratšmits. Pēc Rathschmidt teiktā, Reddit ir notriekusi rāpuļprogrammas, kas vēlas izmantot datus, lai apmācītu AI modeļus.
Rātšmits turpina teikt, ka Reddit ir bijis “diskusijās ar vairākām meklētājprogrammām. Mēs neesam spējuši panākt vienošanos ar viņiem visiem, jo daži nespēj vai nevēlas dot izpildāmus solījumus par Reddit satura izmantošanu, tostarp to izmantošanu AI.”
Ja tā ir taisnība, tas būtu labi Reddit. Tomēr mēs nevaram nepamanīt, ka tikai Google meklētājprogrammas, šķiet, sasniedz Reddit, un tas ir vienīgais uzņēmums, kas ar to parakstījis 60 miljonu dolāru darījumu. Ņemot vērā šo informāciju, šķiet, ka Reddit ir ieinteresēts ļaut vietnēm pārmeklēt tikai tad, ja tās maksā. Tas tiks apstiprināts, ja mēs redzēsim ziņas par Microsoft vienošanos ar Reddit, un pēkšņi Bing rezultātos sāk parādīties jaunākās Reddit ziņas.
Reddit jau ir ļaunticīgi pret saviem lietotājiem. Pagājušajā gadā notika visas pretrunas par to, ka uzņēmums iekasēja pārmērīgu naudas summu, lai piekļūtu savam API. Pēc tam lietotāju datu parakstīšana pakalpojumā Google, lai tos varētu izmantot AI. Ja Reddit patiešām pārdod meklētājprogrammām piekļuvi savai vietnei, tas patiešām varētu pasliktināt savu redzējumu sabiedrības acīs.
Attīstības stāsts
Kā minēts, šis stāsts joprojām ir attīstības stadijā, tāpēc tas tiks atjaunināts, ja virspusē nonāks papildu informācija. Mēs joprojām gaidām kādu atbildi no Google par visu situāciju.