Automattic, firma za tym stoi WordPress i Tumblr, prowadzi rozmowy w sprawie zarabiania na treściach użytkowników poprzez sprzedaż swoich danych firmom zajmującym się sztuczną inteligencją, w tym MidJourney i OpenAI. Te dane z platform blogowych Tumblr i WordPressDo celów szkoleniowych używana będzie domena .com modesztucznej inteligencji.
Chociaż szczegóły transakcji są nadal niejasne, wiadomość wzbudziła obawy użytkowników dotyczące potencjalnego niewłaściwego wykorzystania ich prywatnych treści na obu platformach blogowych. 404 Media sugeruje również, że wewnętrzne konflikty powstały w Automattic, ponieważ gromadzone treści obejmowały dane prywatne, które nie miały być przechowywane w firmie.
W odpowiedzi na sprzeciw Automattic ma wprowadzić nową funkcję, która pozwoli użytkownikom zrezygnować z udostępniania danych na potrzeby szkolenia AI. Firma w poście na blogu potwierdza swoje zaangażowanie w zapewnianie użytkownikom serwisu Tumblr i Worduzyskać większą kontrolę nad ich treścią. Wspomina się w nim o uruchomieniu ustawienia „zniechęcającego do eksploracji firm zajmujących się sztuczną inteligencją”, wyjaśniając, że wiodące platformy eksploracji sztucznej inteligencji są domyślnie blokowane.
Problematyka wykorzystania treści z blogów przez firmy rozwijające modele AI nie ogranicza się jedynie do platform zarządzanych przez firmę Automattic. aż tak bardzo OpenAI Podobnie jak Google, korzystają z robotów indeksujących, które zbierają informacje ze wszystkich stron internetowych w celu uczenia modeli sztucznej inteligencji. Proces ten przypomina zbieranie danych przez wyszukiwarki.
Jak możesz blokować OpenAI i Gemini (Bard) pobierają dane z Twojego bloga?
Jeśli posiadasz bloga lub stronę internetową i nie chcesz, aby dane z niej zawarte były wykorzystywane do uczenia modeli sztucznej inteligencji OpenAI i Gemini, możesz zablokować robotom dostęp do Twoich treści. To ograniczenie można ustawić za pomocą pliku robots.txt
.
OpenAI Crawlers
User-agent: GPTBot
Disallow: /
Gemini Crawlers
User-agent: Google-Extended
Disallow: /
Po zapisaniu pliku robots.txt z nowymi wierszami przejdź do Konsoli Google, aby: Settings > robots.txt > kliknij menu z trzema kropkami, kliknij „Request a recrawl".
Związane z: GPT-5 i nowy przeszukiwacz internetowy GPTBot opracowany przez OpenAI.
Dla użytkowników Tumblra i Wordpress, dostęp do wyszukiwania danych z blogów wg OpenAI lub inne firmy zajmujące się rozwojem sztucznej inteligencji, będą mogły zostać zablokowane za pomocą narzędzi udostępnionych przez firmę Automattic.