Привет, это Эван, и все мы знаем: кто владеет информацией — тот владеет миром.
У нас на кончиках пальцев — все знания и умения человечества за тысячи лет.
Но эффективно ли мы их используем? О нет.
Хорошая для нас новость в том, что можно делать иначе.
Как часто поступают люди, когда им необходимо найти информацию с помощью интернета:
- Пишут поисковый запрос в Google или Яндекс и читают ссылки
- Обращаются к простейшему нейропоиску (а-ля Яндекс Нейро)
- Спрашивают у ИИ-моделей (LLM) вроде GigaChat, ChatGPT, Grok и т. д…
Наверняка у вас возник вопрос:
"А что не так с третьим способом?"
Но сначала быстро поясню про первые два.
Когда нам нужна информация, ответ, знание — ключевая метрика это достоверность, качество и разнообразие информации по теме.
1. Если мы пишем поисковый запрос в Google или Яндекс, то мы получаем не самые качественные, достоверные и разнообразные ответы.
Мы получаем самые "продвинутые" в поисковой выдаче — разными способами.
Большинство из них будут иметь коммерческий подтекст или являться обычным SEO-мусором.
Это критично, когда мы ищем ответы на важные вопросы.
Скажем, на вопрос по здоровью — получим статьи, которые продают услуги клиники.
2. Если мы воспользовались нейропоиском, то результат может быть чуть лучше, но база будет состоять из похожего интернет-мусора.
Чтобы продвинуться дальше, стоит понять, как работают эти ИИ-модели.
Профессионально они называются LLM — Large Language Models, или большие языковые модели.
Они обучены на информации на разных языках.
На том, что уже есть в интернете. И на энциклопедиях, учебниках, научных изданиях. Включая данные, которых НЕТ в интернете (но есть на определенном языке!).
Тут мы и приходим к проблеме способа №3, который многим кажется продвинутым!
Большинство людей задают вопросы LLM на русском языке. Это логично — для меня тоже русский родной и любимый язык.
Но.
На русском языке информации в интернете существенно меньше.
Учебников, научных изданий и академической