Эссе поясняет некоторые особенности работы Википедии (или мнение части участников об этих особенностях). Эссе не является правилом или руководством. Вы можете обсудить эту страницу или обновить её.
Искусственный интеллект используется в различных областях движения Викимедиа — от перевода до определения качества правок. В 2022 году всплеск интереса к ChatGPT привёл к более глубокому изучению возможностей применения машинного обучения (ML) и больших языковых моделей (LLM) при работе с контентом в Википедии.
ИИ-улучшение статей (октябрь 2024). Три результата обработки статей при помощи экспериментального ИИ-промпта (первая — с использованием Claude, вторая и третья — ChatGPT o1-preview):
Промптом называется задание, которое пользователь вводит для получения ответа от ИИ. В силу культурных особенностей, большинство новичков пытается сформулировать лаконичные промпты: как запрос к поисковику или в виде задачи из учебника. Это весьма непродуктивный подход, ИИ нужно давать весьма подробные инструкции, представляя себе, что вы учите добросовесного новичка с совершенно отличным от вашего культурным опытом. Можно давать примеры того, что вы ожидаете, и вставлять тексты источников, но чётко отделяйте подобные тексты от ваших инструкций (например, берите в кавычки ``` ```). Экспериментируйте, и вы почувствуете балланс между излишней подробностью и лаконичностью.
Lift Wing — инфраструктура Фонда Викимедиа для обслуживания моделей машинного обучения (ML), внедрённая в рамках модернизации ML около 2023 года
mw:Machine Learning — домашняя страница команды машинного обучения Фонда Викимедиа (включает публичные обновления о текущей работе над инфраструктурой ML)
Будущая аудитория — инициатива Фонда Викимедиа, сосредоточенная на небольших экспериментах для определения будущих инвестиций. Одним из двух ключевых направлений в 2023/24 финансовом году были эксперименты с разговорным и генеративным ИИ. Проводятся ежемесячные видеоконференции, открытые для участия всех желающих.
Советы и рекомендации
Общие
Вот ключевые советы для начинающих пользователей нейросетей.
0. English – is a key.
Приготовьтесь к тому, что будет много английского. Документация, релевантные советы, промпты, видео и прочее – всё это, как правило, на английском. Есть много хороших материалов и на русском, но если вам интересна тематика – то без понимания англоязычных текстов будет сложно.
Хорошая новость: LLM очень хорошо умеют переводить тексты на русский и, в целом, неплохо понимают запросы на разных языках, включая русский. Пользуйтесь этим, не будет ошибкой делать запросы не на английском языке.
Будьте честны в использовании ИИ-генерированного контента
8. Следите за развитием технологий
Возможности нейросетей быстро растут
Появляются новые инструменты и подходы
Важно периодически обновлять свои знания
9. Давайте один и тот же запрос разным нейросетям
Это поможет подсветить случайные ошибки.
Ключевые ошибки
Вместо вдумчивого диалога использовать модель только в режиме "вопрос-ответ", при котором теряется до 95% потенциала модели
Не перепроверять ответы через другие модели и источники информации, забывать про возможность моделей "галлюцинировать"
Не учитывать, что модель копирует стиль общения пользователя, а также содержит предрассудки из обучающих данных
Забывать, что модель способна подстраиваться под его же когнитивные искажения, и давать "желаемые" ответы
Не структурировать четко свои запросы, давая расплывчатые инструкции
Чрезмерно доверять модели, принимая её ответы за чистую монету без критического анализа
Использовать для задач, требующих актуальных данных, забывая про ограничения модели
Советы при работе в Википедии
Презентация «Как ИИ может помочь вам в вашей жизни в Википедии?» от CEE Hub; Ссылка на видео(Passcode: h$BOin4?)
Вот ключевые рекомендации по эффективному использованию LLM для работы над статьями Википедии. Их использование снизит ожидания от возможностей нейросетей и уменьшит вероятность появления фрустрации или раздражения из-за того, что результат не соответствует вашим ожиданиям.
1. Используйте LLM как помощника для первичной обработки текста, а не как генератора готовых статей. Особенно полезно:
Переформулирование текста для улучшения читаемости
Исправление грамматических ошибок
Структурирование информации
Создание списков и таблиц
Оформления шаблонов и викификации текста
2. 🚨Всегда проверяйте факты из генерируемого контента по авторитетным источникам. LLM могут «галлюцинировать» и создавать правдоподобные, но ложные утверждения.
3. Сохраняйте нейтральную точку зрения. Проверяйте сгенерированный текст на наличие оценочных суждений и удаляйте их.
4. Используйте четкие промпты с указанием:
Необходимости энциклопедического стиля
Требования нейтральности
Запроса на структурированную информацию
Просьбы указывать места, требующие цитирования
5. При работе с переводами:
Сначала получите базовый перевод от LLM
Затем проверьте его на точность передачи смысла
Адаптируйте под стиль русской Википедии
Проверьте корректность терминологии
6. Не полагайтесь на LLM для:
Создания списков источников
Генерации статистических данных
Написания разделов, требующих экспертных знаний
Создания оригинальных исследований
7. При редактировании существующих статей:
Используйте LLM для анализа структуры и предложений по улучшению
Проверяйте предложенные изменения на соответствие правилам
Сохраняйте значимую информацию из оригинала статьи и проверяйте, что он не была удалена или искажена
8. Регулярно сверяйтесь с правилами Википедии и руководствами по стилю, чтобы обеспечить соответствие контента требованиям проекта.