Top.Mail.Ru
Истории

ChatGPT обучали работники из Африки — теперь чат-бот повторяет их языковые привычки

Истории
Дарья Сидорова
Дарья Сидорова

Редактор направления «Истории»

Дарья Сидорова

Пользователи заметили, что в ответах ChatGPT некоторые слова встречаются гораздо чаще, чем в глобальном интернете. Например, чат-бот часто использует слово delve (углубиться, вникнуть), не особо распространенное в американской и британской версии английского. И это не случайность, а, вероятно, следствие того, как система создавалась.

ChatGPT обучали работники из Африки — теперь чат-бот повторяет их языковые привычки

В конце марта Джереми Нгуен, инфлюенсер в сфере ИИ из Технологического университета Суинберн в Мельбурне, обратил внимание на то, что в своих ответах ChatGPT часто использует слово delve (углубиться, вникнуть). Конечно, если это слово встречается в тексте, это не значит, что он сгенерирован ИИ. Однако в масштабе ситуация совсем другая.

Так, на сайте с биомедицинскими исследованиями PubMed слово delve встречается в 0,5% статей — это в 10-100 раз больше, чем несколько лет назад. А значит, эти статьи могли быть частично написаны с помощью ChatGPT.

Фото в тексте: Джереми Нгуен / X

Однако слово delve — не самое любимое у ChatGPT. Согласно другому набору данных, в его текстах также встречаются чаще, чем в интернете в целом, и некоторые другие слова. Среди них — explore (исследовать), tapestry (гобелен), testament (завет, завещание) и leverage (использовать). И это не случайность, а, вероятно, следствие того, как чат-бот создавался.


Читайте по теме:

60% ответов GPT-3.5 являются плагиатом — исследование

Илон Маск намерен сделать чат-бота Grok политически нейтральным


GPT-4 — это большая языковая модель, которая обучена почти на всех англоязычных текстах в интернете. Чтобы превратить ее в полезный чат-бот, используют метод обучения с подкреплением на основе отзывов людей (reinforcement learning with human feedback, RLHF). Тестировщики-люди задают вопросы и дают инструкции исходной версии модели, а также предоставляют ей фидбек — ставят лайки и дислайки или пишут текстовый ответ.

Такое обучение стоит дорого, поэтому крупные компании передают его на аутсорсинг в менее богатые страны, где можно дешево нанять англоговорящих работников.

Если сравнивать с интернетом в целом, то ChatGPT использует слово delve слишком часто. Однако в африканской части мировой паутины это слово гораздо более распространено.

В Нигерии слово delve используют в деловом английском гораздо чаще, чем в Великобритании и США. Работники, обучающие ИИ, предоставляли ему примеры на привычном языке. В итоге получился чат-бот, который пишет на языке, близком к африканскому английскому.

Источник.

Фото на обложке: Tada Images / Shutterstock

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Новый мультимодальный ИИ-ассистент от OpenAI сможет распознавать сарказм
  2. 2 Новинка OpenAI, гринвошинг в 40% инвест-фондах, заявления Илона Маска: главное для бизнеса 12 мая
  3. 3 Apple достигла соглашения с OpenAI об использовании ChatGPT в iOS 18
  4. 4 Соглашение Apple и OpenAI, планы SpaceX, юбилей «Мелодии»: главное для бизнеса 11 мая
  5. 5 Все, что вы хотели знать про судьбоносный для Generative AI судебный иск
FutureFood
Кто производит «альтернативную» еду
Карта

ВОЗМОЖНОСТИ

13 мая 2024

13 мая 2024