Индекс стоимости жилья (Общегородской уровень цен на жилье)

Логично индекс стоимости жилья есть ни что другое, как описана выше функция G(t), которая является показателем общего уровня цен на жилье в данном городе. Это не есть цена какой-то отдельной квартиры. Индекс стоимости - общерыночный показатель, по своей структуре что описывает общие тенденции рынка к росту или снижению цен.

Однако перейти от идейного определения к практическому использованию оказывается не так то просто. Поэтому здесь приведен короткий обзор основных практических наработок аналитического центра IRN. RU в этой области.

Прежде всего, следует принять во внимание, что функции оценочных корректировок Lk (pi) могут носить разный характер. Одни из них действительно являются аддитивными, как скажем поправка на наличие или отсутствие телефона или стоимость ремонта на 1 кв. м. площади. Но большинство поправок носят мультипликативный характер, то есть это не увеличение к стоимости фиксированной величины, а умножение, на коэффициент. Поэтому величины Li (pi) распадаются на две части и приведена выше символическая формула принимает более практический вид

Ck (t, pi) = Ak (pi) G(t)+ Bk (pi)

Где Ak (pi) и Bk (pi) описывают мультипликативные и аддитивные локальные корректировки соответственно. При этом для каждого и-ого параметра квартиры, как правило, есть корректировка или одного или другого типу.

Написан выше выражение является масштабной системой из к уравнениям, где к данное единомоментно количество квартир. Для московского рынка жилья это от нескольких тысяч до нескольких десятков тысяч квартир, в зависимости от выбранных баз данных и расчетного шага (еженедельно, ежемесячно, ежеквартально). Это количество уравнений умножается еще на количество периодов (например, недель), в течение которых рассматривается модель. Другими словами, сформулировано задание достаточно сложное и практически не разрешимое точным чином. Поэтому ее решение требует использования тех или других приближений.

Существует два принципиальных подхода к построению приближений. Первый заключается в построении приближенных зависимостей Ak(pi) и Bk(pi) для каждого отдельного параметра на основании статистики за определенный период. Таких как, например, функция спада цены квартиры от расстояния к метро или функция цены от площади кухни и тому подобное В результате зная эти функции и набор цен квартир Ck(t, pi) в данный момент времени можно вычислить набор Gk(t), для данного момента времени.

В идеале все Gk(t), вычисленные таким образом, должны совпадать. На практике же наблюдается разброс этих значений для разных квартир, что и является следствием приближения. Если получен разброс не очень большой, то это служит показателем адекватности подбора функций Ak(pi) и Bk(pi). В результате значения функции G(t) - индексу стоимости на текущую дату можно вычислить, например, путем усреднения:

G(t)= Gk(t)

где символы означают операцию усреднения по всем квартирам текущего периода.

Проведение подобного расчета на разные даты приводит к получению зависимой от времени функции G(t). Каждое значение G(t) связано с предыдущими благодаря общему набору функций Ak(pi) и Bk(pi). Чем больший срок взят для анализа статистики при вычислении этих функций, тем более гладкой выйдет итоговая кривая G(t). И тем сложнее будет согласовывать вид функции Ak(pi) и Bk(pi). Поэтому следует использовать какой-то оптимальный период.

Регулярно обновляя функции Ak(pi) и Bk(pi) по мере появления новой статистики можно достичь большей точности расчетов. Это позволяет учесть, в частности, и ту же слабую зависимость этих величин от времени, а также плавнее связать между собой значение индекса стоимости за разные даты. Такая структура алгоритма есть одной из основных причин, которые снимают статистические скачки индекса стоимости.

В этом и заключается очень важное отличие между технологией вычисления средней цены и технологией расчета индекса стоимости. Средняя цена вычисляется путем операции среднего значения по данным текущего периода. Значение следующего периода вычисляется уже по отдельной базе, никак не связанной с базой предыдущего периода. Поэтому значения за разные даты статистически не связаны и испытывают скачки. В технологии расчета индекса стоимости эта связь возобновлена, благодаря чему каждое значение определяется набором предыдущих, что во многом гасит статистический шум.

Второй подход к построению приближений заключается в следующем. Минув расчет функций Ak(pi) и Bk(pi) непосредственно приблизительно вычисляется значение функции G(t), а уже на основании его корректировки Ak(pi) и Bk(pi). Этот подход более созвучен вычислению средней цены. Хотя и владеет теми же недостатками. Если мы усредним начальную формулу, то получим следующее выражение:

Ck (t, pi) = Ak (pi) G(t)+ Bk (pi)

где символы означают операцию усреднения по всем квартирам текущего периода. Функция G(t) при этом, понятно, является общей для всех квартир.

Даже в этом виде функция G(t), и средняя цена C (t) = Ck (t, pi) - разные вещи. Они могут отличаться на постоянное слагаемое или на коэффициент. Чтобы все же окончательно возвести G(t) к средней цене, следует использовать условия нормирования:

Ak (pi) = 1

Bk (pi) = 0

Тогда индекс стоимости станет средней ценой. Но только для одной дать. Потому что написаны выше условия нормирования могут выполняться для данных за один период, но уже не будут выполняться (по крайней мере точно) за другой и все последующие. Поэтому за каждый следующий период средние значения функций корректировок начнут отклоняться от 1 и 0, в результате чего между индексом стоимости и средней ценой начнет появляться разница. Та же разница, которая в рассмотренном раньше приближении возникала за счет связи баз за разные периоды и уменьшала статистический шум.

Это происходит из-за того, что вычисления средней цены и оценочных корректировок Ak(pi) и Bk(pi) во многом синхронно. Прыжок средней цены вверх возникает из-за наличия в базе данного периода большего количества дорогих квартир. А значит больше квартир с позитивными корректировками и средние значения корректировок в этом случае выше 1 и 0. А отношения завышенной средней цены и завышенных корректировок приводит к относительной стабильности функции G(t). Именно этот механизм отсутствует при прямом вычислении средней цены, в результате чего остаются скачки.

Использование второго приближенного подхода в меньшей степени гасит статистический шум индекса стоимости или вообще не гасит, если не перечислять каждый раз оценочные корректировки. Эта проблема становится особенно актуальной, когда индексы вычисляются не для города в целом (на большой статистике), а для узкого сегмента, например, одного района. В этом случае (если не есть желание или возможности прорабатывать полностью весь расчет) в соответствии с представлениями об инертности рынка недвижимости можно использовать те или другие сглаживающие алгоритмы.

Хорошо это или плохо вопрос философский. Кто-то считает, что подобная искусственная модернизация начальных данных недопустимая. И отдает преимущество прямому расчету средней цены по простой формуле. Но этот формально правильный подход может часто давать абсолютно неадекватные результаты. Например, выдавать статистические выбросы за взлет цен в одном месяце и спад в следующем. Подобно тому, как нагрет ярким солнцем градусник может на морозе показывать плюсовую температуру. Поэтому представляется правильнее корректировать прямые вычисления, в том числе и использовать приглаживание в тех случаях, когда на инертном рынке выходят очевидные статистические скачки.

Впрочем, существуют и другие способы борьбы со статистическими выбросами еще на этапе подготовки базы. И это является еще одним важным элементом расчета индексов аналитического центра IRN. RU. Логическая сторона этого вопроса связана также с тем, что квартиры не являются однородным биржевым товаром. Для построения их единственных характеристик необходим способ приведения всех квартир к единственному знаменателю.

Эта операция получила название выделения однородного ядра базы квартир. Ее суть заключается в том, что все множество квартир на текущую дату можно представить в виде набора точек в аналитическом N-мерном пространстве, где каждое измерение один из набора параметров квартир pi, какие мы вспоминали раньше.

Большинство квартир группируются в центре этого N-мерного пространства, образовывая своеобразную тучу. Это квартиры со стандартными параметрами, которые создают минимум статистических выбросов. Рынок жилья в Москве такой, что большинство квартир стандартные и имеют похожие характеристики. Но кроме тучи есть еще и периферия квартиры с нестандартными параметрами (элитное жилье, малогабаритки и т. п.), наличие которых как раз и может вызывать статистический шум.

Суть выделения однородного ядра заключается в удалении квартир периферии. Это можно сделать разными способами. Например, путем удаления крайних квартир по каждому отдельному параметру - измерению. Другой способ построение плавных распределений, например, количества квартир по площади кухни. Они будут иметь форму, близкую к распределению Гауса, в результате чего можно отсечь хвосты за пределами величины, кратной дисперсии.

Есть и более утонченные методы. Например, введение в этом N-мерном просторные понятия расстояния. И удаление квартир, расположение которых к центру превышает критический порог. Физическая аналогия этого подхода напоминает определение центра масс системы, позволяющегосвести движение многих частиц, к движению одной точки. Положение которой в применении к рынку недвижимости и есть общий для всех квартир показатель индекс стоимости жилья.

Можно ввести понятие качества квартиры на основании ее параметров и соотнести его с заявленной ценой. Тогда следует удалить из базы квартиры, в которых цена сильно не отвечает качеству, например, квартиры за МКАД по цене элитного жилья или наоборот. Квартиры в панельных домах, дороже, чем аналогичные квартиры в кирпичных домах того же свойства в том же районе и так далее и тому подобное

Существует и много других приемов, которые позволяют сделать начальную базу однородной и исключить большинство источников статистического шума. Во многом это зависит от состава самой базы и особенностей городского рынка. Как правило, при подобных чистках отдаляется до 20% квартир, хотя бывает меньше. Теоретически можно удалять и больше, оставляя только самый центр ядра базы, но эта крайность также не хорошая. Уменьшается объем статистики и растет соответствующая погрешность.

Также следует отметить, что основную роль в расчетах индексов играют более емкие и более оперативные базы данных предложения, в первую очередь эксклюзивы риелтерских компаний. Данные по реальным продажам более мизерные и не позволяют только с их помощью вычислять индексы, особенно когда речь идет о еженедельных индексах по отдельным сегментам рынка. Однако с их помощью можно построить систему корректировок уровня цен предложения к уровню цен продаж и периодически их обновлять. Поэтому уровень индекса стоимости выходит на несколько процентов ниже уровня средних цен предложения, вычисленных прямым путем. Эта поправка имеет порядок около 5% и при нынешнем уровне цен составляет около 100$ за метр.

Однако наличие этой поправки, которая изменяется со временем, служит причиной дополнительных отличий между индексом стоимости и средней ценой предложения. Кроме отличий, связанных с разной логикой построения этих величин. Поэтому не только сам уровень индекса стоимости и средней цены предложения может различаться, но и темп их изменения в какой-то промежуток времени. График средней цены предложения и темп его изменения часто может отображать статистические скачки, тогда как индекс стоимости является результатом модели плавных изменений на рынке. В эт