Публикации


Вопросы кластеризации в процедуре государственной кадастровой оценки земель садоводческих, огороднических и дачных объединений вне черты поселений.

Вопросы кластеризации в процедуре государственной кадастровой оценки земель садоводческих, огороднических и дачных объединений вне черты поселений.

Начиная с 2000 года в Российской Федерации проводится государственная кадастровая оценка земель. Для оценки практически всех категорий земель используется кластеризация объектов оценки.
В категории земель «Земли садоводческих, огороднических и дачных объединений» объектами оценки являются земли садоводческих, огороднических и дачных объединений, находящихся вне черты поселений на территории Субъекта Федерации. Результатом работ являются удельные показатели кадастровой стоимости земель дачных, садоводческих, огороднических товариществ в денежном выражении за единицу площади (например, в рублях за кв. м.).
При выполнении работ необходимо руководствоваться:
- Методикой государственной кадастровой оценки земель садоводческих, огороднических и дачных объединений, утвержденной Приказом Росземкадастра от 26.08.2002 № П/307
- Техническими указаниями (далее ТУ) по государственной кадастровой оценке земель садоводческих, огороднических и дачных объединений, утвержденными Приказом Росземкадастра от 05.06.2002 г.

Для выполнения работ разработано Специальное программное обеспечение (СПО) «Государственная кадастровая оценка земель садоводческих, огороднических и дачных объединений вне черты поселений на основе кластерного анализа данных об имеющихся сделках».

СПО предназначено для проведения кластеризации и получения расчетных цен объектов оценки. СПО разработано специалистами Государственного унитарного предприятия «Нижегородский информационный центр Реформа» по заданию Федерального кадастрового центра «Земля».

Проведение кластеризации

Кластеризация проводится для сокращения объема выполняемых работ и повышения точности модели расчета. В результате кластеризации объекты оценки объединяются в кластеры на основании значений характеристик, влияющих на формирование рыночной цены объектов оценки. Эти характеристики называют оценочными факторами, или факторами.
Для проведения кластеризации используются рыночные цены некоторого количества объектов оценки. Соотношение между количеством факторов и требуемым количеством рыночных цен приведено ниже.
После проведения кластеризации в каждом кластере определяются расчетные цены всех объектов оценки. На основании сравнения рыночных цен и расчетных цен рассчитываются критерии адекватности - коэффициент определенности и относительный разброс. Для кластеров, в которых их значения допустимы, расчетные цены утверждаются. Для кластеров, в которых критерии адекватности выходят за пределы допуска, Методикой и ТУ предусмотрен расчет удельных показателей кадастровой стоимости на основании информации, полученной в процессе проведения государственной кадастровой оценки земель поселений и минимального удельного показателя кадастровой стоимости садоводческих объединений в кластере с допустимыми значениями критерия адекватности.
Таким образом, для применения процедуры кластеризации необходимо собрать информацию о факторах и получить рыночные цены объектов оценки. В процессе кластеризации выполняются следующие действия:
- разбиение объектов оценки на кластеры;
- получение в каждом кластере расчетных цен объектов оценки;
- расчет в каждом кластере коэффициента определенности и среднеквадратичного отклонения.
- Согласно Методике и ТУ, в процессе выполнения работ проводится первичная и вторичная кластеризация.
Первичная кластеризация
Первичная кластеризация проводится по одному из ценообразующих факторов. Для проведения первичной кластеризации рекомендуется выбрать фактор, оказывающий наибольшее влияние на формирование рыночной цены объектов оценки. Часто используется фактор «Расстояние до центра Субъекта Федерации».
Интервалы значений фактора определяются практически. Количество интервалов определяет количество первичных кластеров. Например, по Нижегородской области определено 4 первичных кластера: расстояние до Нижнего Новгорода до 5 км, от 5 до 15 км, от 15 до 30 км, свыше 30 км.
В случае если нельзя выбрать главенствующий фактор, можно не проводить первичную кластеризацию. При этом в СПО в первичной кластеризации задается разбиение на 1 кластер со значением интервала по минимальному и максимальному значению в первом факторе. Тогда в единственном первичном кластере окажутся все объекты оценки.

Вторичная кластеризация
При проведении вторичной кластеризации используются все ценообразующие факторы.
Вторичная кластеризация проводится на основе первичной, т. е. внутри каждого кластера, образованного в процессе проведения первичной кластеризации.
Кластеризация является итерационным процессом, внутри кластера второго уровня можно проводить разбиение на кластеры третьего уровня и т. д.
Процесс проведения кластеризации предполагает выбор способа измерения расстояния между объектами и выбор способа объединения объектов в кластеры.
В СПО реализованы различные математические методы измерения расстояния между объектами в многомерном пространстве (метрика Евклида, метрика Махаланобиса, метрика Минковского), различные способы объединения объектов в кластеры (медианная связь, серединная связь, связь «ближний сосед», связь «дальний сосед»).
Описание типов связей, используемых в процедуре кластеризации
В СПО реализованы различные модели кластеризации (алгоритмы кластерного анализа). В процессе кластеризации определяется оптимальная модель. Критерием оптимальности модели являются значения коэффициентов адекватности.
Пусть на некотором шаге кластерного анализа объединились кластеры i и j с числом объектов ni и nj в каждом из них, тогда расстояние di+j, k между объединенным кластером i+j и любым из остальных кластеров k вычисляется как среднее взвешенное из расстояний dik и djk
di+j, k=(nidik+njdjk)/(ni+nj).
В этом случае алгоритм кластерного анализа носит название алгоритма «средней связи».
Если вместо среднего взвешенного используется простое среднее
di+j, k=(dik+djk)/2,
то получается алгоритм «медианной связи».
Формула
di+j, k=min(dik, djk)
дает алгоритмы «минимальной (одной) связи» (или «ближайшего соседа»), а формула
di+j, k=max(dik, djk)
- алгоритм «максимальной (полной) связи» («дальнего соседа»).
Алгоритм «максимальной связи» имеет тенденцию образовывать кластеры одинакового размера, даже если это не соответствует естественным границам между ними. Наоборот, алгоритм «ближайшего соседа» объединяет в один кластер далеко отстоящие объекты, если существует соединяющая их цепочка из близких между собой объектов. Алгоритмы «средней и медианной связи» являются промежуточными по своим свойствам между алгоритмом «дальнего соседа» и «ближайшего соседа».
Рекомендации проведения вторичной кластеризации
При проведении вторичной кластеризации в СПО для каждого кластера выбирается способ измерения расстояния между объектами и способ объединения объектов в кластеры.
В процессе выполнения работ проводится несколько вариантов кластеризации для выбора оптимального варианта кластеризации. Используется различное количество факторов кластеризации, различные интервалы разбиения, различные способы измерения расстояний между объектами, различные способы объединения объектов в кластеры.
Выбор оптимального варианта кластеризации обосновывается значениями критериев адекватности.
Соответствие количества факторов кластеризации и количества рыночных цен
Важно учитывать связь между количеством факторов кластеризации и количеством рыночных цен в кластере.
Необходимым условием проведения расчета является следующее соотношение: количество рыночных цен в каждом кластере должно быть на одну единицу больше, чем количество факторов кластеризации. Например, при работе с десятью факторами в каждом кластере нужно иметь рыночные цены не менее чем одиннадцати объектов оценки.
Достаточным условием проведения расчета является следующее соотношение между количеством факторов кластеризации и количеством рыночных цен в кластере: количество рыночных цен в каждом кластере должно быть в три раза больше, чем количество факторов кластеризации. Например, если вы работаете с 10 факторами, то в каждом кластере желательно иметь в общем случае 30 рыночных цен объектов оценки.
Это должны быть цены на объекты оценки, различные по значениям факторов кластеризации.

Критерии адекватности

Критериями адекватности являются коэффициент определенности и относительный разброс.
Критерии адекватности определяют близость расчетной и введенной цены по каждому объекту оценки.
Модель адекватна, если значение коэффициента определенности более 75 процентов (0,75), а относительный разброс не превышает 20 процентов (0,2).
Часто на практике коэффициенты могут быть вне допустимых значений. В таком случае Методика рекомендует либо пересмотреть оценочные факторы, либо увеличить количество рыночных цен.
Коэффициент определенности
Предположим, в процессе кластеризации получен некий кластер. Количество объектов в кластере равно N расчетное. В некоторых объектах имеется рыночная цена ( – рыночная цена i-того объекта). Количество объектов, для которых имеется введенная цена, равно N рыночное. В кластере для каждого объекта получена расчетная цена ( – расчетная цена i-того объекта)
Коэффициент определенности R2 рассчитывается для каждого кластера по следующей формуле :
R2 = 1 – sseun / sse,
где
Где sseun =
sse =
– рыночная цена i-того объекта
– расчетная цена i-того объекта
– средняя цена рыночных цен в кластере
В расчете участвуют только те объекты, для которых имеется рыночная цена, поэтому i изменяется от 1 до N рыночное
Относительный разброс
Предположим, в процессе кластеризации получен некий кластер. Количество объектов в кластере равно N расчетное. В некоторых объектах имеется рыночная цена ( – рыночная цена i-того объекта). Количество объектов, для которых имеется рыночная цена, равно N рыночное. В кластере для каждого объекта получена расчетная цена ( – расчетная цена i-того объекта).
Для каждого кластера производится расчет дисперсии рыночных и расчетных цен

, где
– количество рыночных цен в кластере,
– количество объектов в конечном кластере
– рыночная цена i-того объекта
– расчетная цена i-того объекта
– средняя цена рыночных цен в кластере.
– средняя цена расчетных цен в кластере.
После этого определяем ценовые коридоры относительно средних цен шириной в две дисперсии

      Теперь определяем, на сколько пересекаются ценовые коридоры

и относительный разброс r равен

Результаты кластеризации

В результате кластеризации получаются кластеры, в которых рассчитаны:
- значения коэффициента определенности и относительный разброс;
- по каждому объекту оценки получена расчетная стоимость единицы площади (в руб. за кв. м.).
Для кластеров, в которых значения коэффициента определенности и относительный разброс допустимы, расчетные цены утверждаются. Это удельные показатели кадастровой стоимости садоводческих товариществ, выраженные в рублях за кв. м.
Для кластеров, в которых:
- нет рыночных цен объектов оценки
- недостаточно рыночных цен объектов оценки
- значения критериев адекватности недопустимы расчет удельных показателей кадастровой стоимости производится согласно методике на основании
-
информации, полученной в процессе проведения государственной кадастровой оценки земель поселений
- минимального удельного показателя кадастровой стоимости садоводческих объединений в кластере с допустимыми значениями критерия адекватности.

Возврат к списку