Полнотекстовый поиск и картотека: переоценённые возможности

Полнотекстовый поиск — отличный инструмент, но со своими недостатками. Многие пользователи ошибочно считают его чудодейственным средством для ведения картотеки. Разберёмся, что с поиском не так.

Зачем искать заметки

Одна из главнейших задач системы заметок — это возможность возвращаться к ним снова.

Вот, например, об этом хорошо сказал Остин Клеон в статье своего блога «The importance of revisiting notebooks»:

One of the things I like about Ryan Holiday’s notecard system, the one he learned from his mentor, Robert Greene, is its emphasis, not just on taking notes, but on going back and revisiting your notes.

Для того, чтобы было возможно вернуться к заметкам, используют различные методы: папки, структуру заметок, теги, карты контента — MOC, индексы и тому подобные.

Однако, много кто использует в качестве основного средства возврата к своим заметкам полнотекстовый поиск. Даже больше, я не раз слышал утверждения, что поиск — это не основной, а вообще единственный способ организации своих заметок.

Вот, например, один из типичных диалогов в телеграм-чате цеттелькастен_ру:

Алексей Фёдоров, [8 янв. 2023 г., 13:24:41]:

Я буксую на этапе организации.

Николай Додонов. Психолог. КПТ, EMDR, [8 янв. 2023 г., 13:30:04]:

Я забил на организацию) Пользуюсь поиском, если нужно что-то найти.

Полнотекстовый поиск, конечно, хороший инструмент, но, как у любого другого инструмента, у него есть свои недостатки, которые не позволяют использовать его в качестве полноценного и единственного средства навигации в заметках.

Поиск по содержанию, а не по смыслу

Главный недостаток полнотекстового поиска можно сформулировать так — он ищет только по содержанию, но не по смыслу заметки. Другими словами, когда человек использует поиск, он находит только слова, которые используются в заметке. И это приводит сразу к нескольким проблемам.

Первый пример — а их в этой статье будет много. 

Допустим, вы забиваете в поиске «стоицизм». Результатом поиска станут заметки, которые СОДЕРЖАТ это слово. Но все ли заметки о стоицизме будут в этом списке? Более чем вероятно, что нет.

Дальше рассмотрим этот пример подробнее.

Ищет не то, что нужно, и наоборот

Пользуясь поиском, мы рискуем получить нерелевантную выдачу и, наоборот, не получить нужный результат.

Продолжим разбирать наш пример с поисковым запросом «стоицизм». Результат выдачи, условно, можно разбить на две категории:

— Заметки, которые содержат слово «стоицизм», и они именно о том, что нам нужно. 

— Заметки, которые содержат слово «стоицизм», но они не о том, что нам нужно.

И есть ещё третья категория заметок, которая не попала в поисковую выдачу — заметки о стоицизме, в которых не содержаться слово «стоицизм».

То есть, кроме действительно нужных нам заметок, мы можем получить не относящиеся к делу. Но, что самое плохое, мы также не получим в выдаче те заметки, которые относятся к искомой теме, потому что слово, которое мы выбрали для поиска, в них не использовалось.

Вот как это работает. В январе я прочитал книгу Нила Геймана «Американские боги» и там был такой диалог.

— Ну и почему ты не удивляешься? — спросил он. — Почему ты не вопишь во всю глотку: «А! Так не бывает!»? Почему ты, мать твою, делаешь то, что я говорю, и принимаешь все это как само собой, блядь, разумеющееся?

— Ты платишь мне за то, чтобы я не задавал вопросов, — сказал Тень. — Ну и вообще, после Лоры меня уже ничто не удивляет, — добавил он и, пока договаривал последнюю фразу, понял, что — и в самом деле, именно так и есть.

— После того как она восстала из мертвых?

— После того как я узнал, что она трахалась с Робби. Вот это было больно. Все остальное — одуванчики. Так куда мы идем?

Я сохранил эту цитату и определил заметку с ней в категорию «Стоицизм». Мне показалось, что этот диалог как нельзя лучше иллюстрирует философию стоиков.

Но в тексте цитаты нет слова «стоицизм» или «философия», да и вообще никакого другого слова, используя которое можно было бы наткнуться на эту заметку в контексте стоицизма.

И наоборот. У меня есть несколько заметок, в которых фигурирует Райан Холидей. В них я нередко употребляю слово «стоицизм», например, в контексте написанных им книг или блога.

Вот заметка с текстом «Райан Холидей продаёт курсы по стоицизму». Она тоже попадётся мне в результатах вышеупомянутого поиска, хотя я писал не о стоицизме, а о видах контента.

Понимаете о чём я? И это не единственная проблема.

Язык — ненадёжный инструмент

Почти все проблемы полнотекстового поиска вытекают из того факта, что он ищет по словам, а язык — крайне ненадёжный инструмент.

Об этом говорил Мортимер Адлер в книге «Как читать книги»:

Если бы язык был чистым и идеальным средством передачи мысли, эти два этапа совпадали бы друг с другом. Если бы каждое слово имело лишь одно значение, а неоднозначность была запрещена, то есть каждое слово представляло собой идеальный термин, язык был бы ясным и прозрачным.

Поскольку язык — это несовершенный инструмент, иногда он препятствует коммуникации.

В главе «Найдите общий язык» Адлер поднимает проблему многозначности слов. Речь о том, что одно слово может иметь разные значения в разных контекстах. И мы снова получаем проблему нерелевантный поисковой выдачи.

Пример — слово «заметки». В моей картотеке есть карточки о заметках, то есть текстовых файлах, и о приложении «Заметки» от Apple. Как мне разделить нужные заметки в поисковой выдаче?

Другой пример — «организация». Я делаю записи об организации заметок. Но ещё я довольно часто пишу тексты, содержащие слово «организация», в смысле компания, трудовой коллектив. В этом случае, если я буду искать заметки об организации заметок, выдача будет содержать лишние записи совсем не по теме.

Противоположная проблема — один термин может обозначаться разными словами. Вот что Никлас Луман говорит об этом в своей статье о чтении «Learning How to Read»:

There is a wide variety of word-choices available. Most readers of theoretical texts cannot even imagine the large role of randomness in this process. Indeed, even most writers usually do not make this clear to themselves. The large majority of passages in a text could also have been formulated differently; and they would have been formulated differently if they had been written on another day. The large mass of not especially significant words necessary for formulating a sentence is not accessible to conceptual regulation.

Слово, которое я выбрал сегодня, для выражения своих мыслей в конкретной заметке, не факт, что вообще придёт мне в голову спустя несколько месяцев, когда понадобится отыскать нужную мысль.

Банальный пример из недавнего прошлого.

В декабре я немного приболел — насморк. Я помню, что год назад или даже больше, записывал в заметки какие-то капли, которые мне тогда очень хорошо помогли. Начал искать. «Насморк», «сопли», «простуда» и даже «болезнь» не дали результата. В итоге, нужная заметка нашлась по запросу «нос».

И повезло, что нашёл. В другой раз я искал ссылку на статью о редактуре, которую, точно помню, сохранял в заметках с небольшим сопроводительным текстом. Но, как не старался, так и не смог найти.

Такие проблемы бывают не только у меня. Думаю, если вы давно ведёте заметки и у вас их много, то тоже оказывались в таких ситуациях.

Речь в примерах выше шла о довольно конкретных терминах: стоицизм, насморк, заметки. И всё равно с ними могут возникнуть проблемы. А теперь представим, что надо найти записи о таких абстракциях, как «любовь», «мышление», «память», «разум». Для описания этих тем можно использовать десятки и сотни разных слов, которые замучаешься перебирать при поиске. Как тут быть? Да никак.

Ошибки в написании и ненадёжная память

От главных недостатков полнотекстового поиска переходим к проблемам поменьше.

Вот с чем ещё не раз приходилось сталкиваться, используя поиск — ошибки в тексте заметки. Если написать слово неправильно, то ни одно приложение не найдёт запись с ним.

Эта проблема актуальна для написания на всех языках. Я как-то написал английское слово «lesson» с одним S и долго потом не мог найти нужную мне заметку с этим словом.

В русском языке можно ошибиться и даже проверка орфографии не поможет. Напишешь «компания» вместо «кампания», ни один заметочник даже не пискнет.

Дополнительные проблемы вызывают особенности русского языка — все эти падежи, приставки, суффиксы.

Кстати, даже сейчас, когда я писал эту статью, я написал «суфиксы» вместо «суффиксы». Хорошо, что Scrivener меня поправил, но не каждое приложение для заметок так умеет.

Другая проблема — это ненадёжность человеческой памяти. Кажется, что заметки и поиск должны полностью избавить человека от необходимости хоть что-то запоминать. Но это не так.

Для того, чтобы сделать поисковый запрос, его надо сначала сформулировать. А для этого надо как можно более конкретно представлять, что тебе нужно. В случае с заметками, лучше всего дословно помнить заголовок нужной заметки или её содержание.

Какое там. Я регулярно пересматриваю свои заметки и очень часто встречаю такие, о существовании которых даже не догадывался.

Со мной солидарен Билли Оппенгеймер, ассистент Райана Холидея. Вот как он описывает такие ситуации, в своей статье «The Notecard System: Capture, Organize, and Use Everything You Read, Watch, and Listen To»:

I’ll be talking or journaling and catch myself reciting (what feels like) word for word from a notecard I’d made. It’s bizarre because, as I said many times above, for the most part, I can’t remember the notecards I’ve made. It’s interesting because, wow, I’ll think, this experience couldn’t exist in this way if I hadn’t made that notecard.

Пример из собственного опыта. Я как-то упомянул в чате слова Зонке Аренса о том, что лайфхаки не работают без целостной системы. Чтобы сэкономить время, открыл электронную книгу «How To Take Smart Notes»и попытался найти эту цитату. Помню, что он говорил что-то про гипотетическую статью про самые лучшие лайфхаки. Перепробовал «life-hack», просто «hack», «top», «most», но без толку.

В итоге, плюнул, открыл бумажную книгу и за пару минут нашёл нужное место. Вот, кстати, эта цитата:

Only when all the related work becomes part of an overarching and interlocked process, where all bottlenecks are removed, can significant change take place (which is why none of the typical “10 mind-blowing tools to improve your productivity” tips you can find all over the internet will ever be of much help).

Поисковые «костыли»

Продвинутые пользователи приложений для заметок умеют обходить несовершенства поиска с помощью различных инструментов.

Например, в Obsidian можно добавлять алиасы в метаданные файла. Алиасы — это альтернативные названия для заметки. Можно добавить варианты написания, например, для заметки «Obsidian» — алиас «Обсидиан», и тогда эта заметка будет находиться при запросе на любом языке: русском и английском.

Мне попался пост в ЖЖ на эту тему, где об этом написано чуть подробнее. Кстати, в начале поста автор как раз перечисляет случаи, когда поиск по тексту может давать осечки.

Другой вариант — использовать расширенные поисковые запросы с операторами типа OR, AND или NOT.

Также есть способы решить проблему падежей. Некоторые пользователи вообще используют в названиях заметок только английский язык, чтобы избежать разночтений при поиске.

Но это всё «костыли», которые появились как раз из-за несовершенства полнотекстового поиска как инструмента. Все эти возможности, которые я мельком описал выше, есть далеко не в каждом инструменте. В Заметках Apple, Evernote или Notion нет продвинутого поиска или метаданных. Не переходить же теперь всем на Obsidian. Тем более, что всё равно его возможности не решат все недостатки поиска.

Да и потом, чтобы воспользоваться всеми этими возможностями, их надо изучить и постоянно использовать, например, прописывать всё те же алиасы. Так поиск, который вроде бы должен был облегчить работу с заметками, добавит дополнительной работы. Например, переписывать названия заметок в алиасы всеми возможными способами.

Поиск не нужен? 

В конце я хочу ещё раз уточнить, что не призываю вообще отказаться от поиска. Я лишь хочу указать на то, что организация заметок нужна не только в аналоговых, бумажных инструментах типа карточек и блокнотов. Даже если вы пользуетесь таким мощным приложением как Obsidian, всё равно надо использовать разные инструменты для возврата к своим заметкам.

Я уже не раз сталкивался с людьми, которые тоже начинали только с поиска, но с ростом количества заметок приходили к пониманию, что только им одним не обойтись.

Можно начать организацию заметок с самого простого — тегов. Это универсальная функция, которая есть почти во всех приложениях для заметок. И хороший вариант для начала — простой и быстрый.

Подписывайтесь на мою рассылку, чтобы получать информацию о новых статьях в блоге, и на мой канал в Телеграме, в котором я публикую посты о ведении заметок, чтении и продуктивности.

А если вам нравится, что я делаю, подписывайтесь на мою страницу на Бусти, чтобы поддержать меня донатом.


Больше на Фёдоров пишет

Subscribe to get the latest posts sent to your email.

3.5 2 голоса
Рейтинг статьи
Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии