城市觀點 | 大資料助力估價業務發展

隨著近年來網際網路產業的不斷髮展和資訊化的持續推進,大資料時代已經到來。“資料”成為這個時期最炙手可熱的名詞。基於海量資料和資訊發展而來的各類技術,已經深刻改變了我們的生活。尤其是在中國,海量資料與人工智慧技術的結合,產生了強烈的化學反應,正在快速推動各行各業向資訊化和智慧化轉變。

一、傳統估價業務面臨的挑戰

大資料背景下,傳統估價業務正面臨以人工智慧技術為代表的新技術的挑戰。近年來,不乏有資料科學和人工智慧領域的論文、賽事等,以野心勃勃的姿態,試圖用純智慧演算法來取代傳統估價在房地產租金、售價等領域的角色。

陳熙和張曉博透過訓練LightGBM模型對56279條住宅租金資料進行了預測,取得了較為理想的擬合結果。謝勇等人在嘗試了多種機器學習模型的基礎上,深度挖掘了房屋面積、商圈位置等因素對住房租金的影響。徐凌峰在其碩士論文中,嘗試了將深度神經網路技術應用於住宅售價的批次評估中,展現了這一技術在此類任務上的潛力。李貞良和曹布陽利用支援向量機迴歸(SVR)模型,在結合寫字樓周邊因素的基礎上,對寫字樓租金進行了預測。

雖然上述研究在評估精度和穩定性上仍達不到實際估價工作的要求,但此類研究的大量開展,充分顯示了大資料在房地產估價領域的應用潛力。與此同時,更多的大資料技術正在被開發和移植到房地產估價領域,不斷挑戰評估精度。傳統估價業務與大資料的融合已經進入現在進行時。

二、大資料帶來的機遇

估價既是一門科學,也是一門藝術。這決定了估價業務是離不開人的因素的。在大資料時代,人依然是估價的主體,而利用大資料作為有力工具,賦能傳統估價業務,推動估價業務的發展,成為估價行業的下一個發展機遇。

在大資料背景下,隨著資訊產生速度的爆炸式增長,資料變得前所未有的易得,建立一個龐大的、擁有豐富內容的估價支援資料庫成為可能。同時,海量資料在統計層面上實現了從量變到質變的飛躍,透過合理的資料分析和挖掘,能更加精準的描繪出資料物件的內在特性,此類工作在傳統的資料收集中是難以實現的。

例如,透過對海量掛牌資料及成交資料的分析,能準確把握市場熱度,反應市場狀況;透過對一二手房地產交易所涉及的戶型、價位的分析,能發現房地產市場重心的轉變,甚至客群的轉變;透過將各類配套、環境資料與產權資料相結合,能快速獲取估價物件全方位的資訊,顯著提高資料收集效率。

綜上,如果能充分發揮大資料時代的優勢,建立一套針對估價業務的資料整合、分析和支援體系,從而為估價業務提供準確的、深入的、全面的資訊,節省資料收集時間,提升估價準確度,將推動估價業務向大資料時代的轉變。

三、大資料應用於估價業務的難點

雖然大資料的應用對於估價行業的發展具有重要意義,但真正將大資料應用到估價實務中,依然存在許多難點問題。

首先,房地產估價是多因素結合的工作,往往需要涉及不同領域的多種資訊。然而,各類資訊受採集來源、採集手段、產生時間、資料標準等因素的差異影響,各類資訊之間、甚至同類資訊之間無法有效互動、參考,形成了眾多資訊孤島,對資訊的利用產生了極大的阻礙。

其次,原始資料往往存在繁瑣、雜亂、分散、冗餘和缺失等種種問題,使得資料質量難以保障,資料蘊含的資訊難以直接展現。資料管理及分析是專業度很高的學科,估價師如果在此類工作上投入大量時間,難免本末倒置。

最後,千萬級的資料雖然攜帶大量資訊,但同時也給資料檢索提出了巨大的挑戰。由於資料門類繁多,往往儲存於數十張資料表內,導致估價師無法高效找到需要的內容,反而降低了工作效率。

上述三個問題的存在,客觀上阻礙了近年來大資料在估價工作中的實際運用。

四、房地產估價支援系統

(一) 房地產估價支援系統的組成

為了解決上述難點問題,我們建立了一套基於大資料的估價支援系統。估價資料支援系統主要分為三部分:估價支援資料庫、推薦演算法、互動系統。

(二) 透過資料整合建立估價支援資料庫

估價支援資料庫是房地產估價支援系統的基礎,是在資料整合的基礎上建立起來的一整套資料採集、儲存、分析、呼叫和管理體系,是估價相關大資料管理的強力工具。

資料整合,即將各來源、型別、作用的資料,統一到同一套資料標準和體系下,使得資料之間能相互關聯、參考、查詢,提升資料維度。在估價支援資料庫中,資料整合工作主要分為統一標準和建立聯絡。

統一標準,即將各類資料的資料標準及內涵進行統一,包括但不限於單位統一、週期統一、範圍統一等。統一標準的工作核心是建立資料標準和質量控制體系,確保在從資料採集、儲存、處理到分析的全流程中,都有統一的資料標準可循,且配套有相應的質量管理和監控。

建立聯絡,即透過技術手段,在不同內容、不同來源的資料之間,建立關聯關係,打通資料鏈條。例如,可以透過匹配演算法,將小區基礎資訊與小區掛牌資訊透過統一的小區ID進行關聯;再如透過地圖座標,將小區與周圍的綠化、基礎設施、商業設施等進行空間上的關聯等。

資料整合的最終目標,是形成能互相呼叫、交叉分析的資料網路,從而解決資料孤島問題。以我們住宅相關資料為例,透過資料整合工作,資料間將實現如圖1所示關聯結構。

在估價支援資料庫的基礎上,以任意資料切入,可以關聯獲取其餘所有的相關資料資訊,大大提升了資料維度,降低了資料獲取難度,提高了資料獲取速度,為資料的深度應用打下了基礎。

城市觀點 | 大資料助力估價業務發展

(三) 推薦演算法支援案例篩選

在估價支援資料庫中,資料量已經達到千萬級。為了在海量資料中準確獲取最符合估價師業務需求的記錄,需要推薦演算法的支援。

以住宅出售掛牌案例為例,在一定的價格區間、面積區間下,往往存在數百條符合條件的記錄。得益於估價支援資料庫的資訊優勢,每一條掛牌記錄除自身資訊外,還可以透過關聯關係,獲取包括小區資訊、樓棟資訊、單套資訊、空間資訊等在內的各類資訊,資料維度得到有效提升。推薦演算法需要在綜合分析各類資訊的基礎上,結合估價師的實際需求,選取最符合特定要求的資訊推送給估價師,用於參考和選用。

估價支援系統中,採用基於專家意見和統計分析的賦分法,來達到推薦合適案例的效果。專家意見,即廣泛諮詢具有豐富經驗的房地產估價專家,總結出在實務中最受估價師關注的、對估價結果影響最大的因素,在賦分中給予較高的優先順序或權重。統計分析,即利用統計方法,對各因素與價格的關聯關係進行分析、評估和擬合,獲取各因素對價格形成的重要程度及影響規律。如透過擬合,獲取檔次對住宅價格的影響水平等。最後,結合專家意見和統計分析結果,分配各因素的權重,制定一套科學的賦分體系,並採用分高優先的方法進行推薦。

基於推薦演算法的案例篩選,優化了案例選取邏輯,提升了案例選取速度和案例質量。最重要的是,結合估價支援資料庫,推薦演算法可以基於多元資料得到綜合評價結果,利用的資訊更多,結果更科學合理。

(四) 面向業務的互動系統

大資料管理是非常複雜的系統性工作。估價師透過資料庫、程式語言等手段去使用大資料是非常不現實和不經濟的。因此,需要一套互動系統作為輔助工具,幫助估價師直觀、快捷獲取想要的資料,而將複雜的資料調取和處理工作交給程式完成,估價師只需要關注估價業務相關的“成品”資料,而不用將時間花費在資料的調取上。

面向業務的互動系統,是房地產估價支援系統中估價師能直接接觸和使用到的部分。面向業務,即系統是根據估價師在估價業務中的實際需求針對性開發的,符合估價工作的流程和思維習慣;互動,即系統提供一定的工具,使得估價師能在一定範圍內與資料進行互動,例如對查詢內容的控制,查詢結果的選擇等。這兩點保證了互動系統能更好的服務於估價師的實際工作需要,提高估價師的工作效率。

互動系統分為明確需求,資料輸出和資料選擇三個部分,隨工作推進依次呼叫。

在明確需求階段,估價師輸入估價物件的產權資訊,系統將自動在估價支援資料庫內查詢對應的資料物件,並將產權資料、地理資訊資料、實物資料等在內的庫內資料返回給估價師。這一階段的工作,將原先估價師需要手動查詢、定位估價物件,手動蒐集、整理相關資料的繁瑣過程,打包為一鍵完成的資料調取工作。與傳統估價流程相比,這一改變的主要優勢體現在:

(1) 將資料收集工作簡化為數秒內即可完成的簡單步驟,極大提高了工作效率。

(2) 資料的完整性和準確性得到了保證。

(3) 資料均採用統一的資料標準,方便互相比對。

在完成單套定位後,估價師可以根據委託實際情況和估價實際需要,對相關資訊進行檢查和微調,使資料更符合特定估價業務的實際情況。

在資料輸出階段,系統根據上一階段提交的估價物件資料,呼叫預設的推薦演算法,從估價支援資料庫內篩選符合要求的案例資料和成交資料,並返回給估價師。與此同時,與估價物件相關的其他資料,例如市政配套設施、周邊綠化、交通情況、商業情況、生活配套設施情況等其他估價相關內容,也將同時提供給估價師做選用和參考。

以互動系統作為工具,降低了估價實務中資料應用的複雜度,提高了估價師的工作效率,提升了估價質量。

五、總結

房地產估價支援系統,能有效解決資訊孤島問題,並在此基礎上提供靈活便捷的互動體驗,使得估價師能高效利用大資料時代的資訊優勢,實現估價效率和估價質量的提升。

同時需要指出的是,解決實際應用難題依然只是大資料在估價實務中應用的基礎,在未來這一領域仍有許多發展的空間。一方面,可以嘗試將人工智慧技術在推薦演算法領域的成就,移植到估價支援系統的案例推薦中來,實現更加智慧精準的推薦效果;另一方面,可以繼續深挖資料價值,擴寬資料種類,不斷豐富估價支援資料庫的內容。

綜上,房地產估價支援系統的開發,是推動傳統估價向大資料時代邁進的重要內容,是推進估價業務進一步發展的重要方向。