Одной из основных проблем в каталогах ресурсов интернет является проблема рубрикации интернет-ресурсов. Существует ряд подходов, которые могут быть применены для решения данной проблемы.
Классическим подходом является таксономическая рубрикация. Такой вид рубрикации подразумевает наличие заранее заполненного административным персоналом каталога перечня разделов. Как правило таксономический рубрикатор является иерархическим и на практике не содержит более трех уровней вложенности. Таксономический подход ограничивает свободу пользователя, регистрирующего ресурс, т.к. список разделов задан заранее и редактировать его не представляется возможным. Также, при таком подходе может возникнуть проблема отнесения интернет-ресурса к двум различным релеватным разделам (обычно в каталогах допускается для одного ресурса использовать только один, наиболее подходящий раздел).
Одним из современных подходов, получившим широкое распространение является фолксономический подход, позволяющий осуществлять рубрикацию при помощи тегов. Тег – это специальный маркер, ассоциированный с ресурсом, указываемый пользователем в свободной форме. Фолксономическая рубрикация практически не накладывает никаких ограничений на пользователя, поэтому она получила высокую популярность и используется на многих интернет-ресурсах нового поколения. Однако и существуют проблемы, связанные с фолксономическим подходом, для которых на данный момент не существует формальных методов решения: одной из таких проблем является указание нерелеватных тегов – пользователь может указать тег, который не связан с действительным содержанием интернет-ресурса (однако, это можно отследить, например, при помощи эвристических алгоритмов). Другой проблемой является указание смежных тегов для одних и тех же смысловых значений, например тегов в разных формах: «ИТ», «информационные технологии», «информационная технология», «IT» - все эти теги должны ссылаться на один и тот же элемент фолксономической структуры, а определить связь между ними типичными алгоритмами не представляется возможным, такую проблему нужно так же решать эвристическими способами.
Также существуют и другие методы классификации интернет-документов, в том числе и мало пригодные для интернет-ресурсов методы, такие как УДК, ББК и т.п.
Ряд интернет-каталогов использует и другие, не получившие широкое распространение методы классификации, например фасетную классификацию (используется в каталоге Яндекса) – такой подход требует значительных ресурсов для указания фасетных признаков и его использование затруднено.