Ich bin der leitende Forscher für eine kommerzielle Immobilienmaklerfirma. Ich kenne keine perfekte Quelle für das, wonach Sie suchen, aber hier sind einige Proxys, die Sie ausprobieren könnten
Bezahlte Option: Costarhttp://www.costar.com/ hat was einige von dem, was Sie wollen, aber sie sind ein kostenpflichtiger Service. Von Zeit zu Zeit habe ich gehört, dass sie den Datenzugriff für Forschungszwecke verschenken. Ich glaube nicht, dass sie die gesamten USA abdecken, und sie betrachten nur CRE über einer bestimmten Dollargröße (so etwas wie $ 5,000)
Kostenlose Option: CraigslistScrape craigslist.org für Bürogebäude Inserate. Zum Beispiel kann ich die ersten 100 in New York aufgelisteten Büroräume unter der URL http://newyork.craigslist.org/search/off
herunterladen, wenn Sie „?s=100“ bis zum Ende dieser URL (dh „http://newyork.craigslist.org/search/off?s = 100 „), erhalten Sie Listen 100-199 von 2500. Durch inkrementelles Ändern der „aus?s = x“ Teil, können Sie alle 2500.Natürlich werden c-Listings im Durchschnitt kleinere Immobilien sein, aber ich wette, die Abdeckung ist ziemlich gut und die Verzerrung wird in allen Regionen konsistent sein.
Update: Scraping aller Basis-URLs von der About-Seite
Wenn Sie R verwenden, können Sie mit rvest() alle Basis-URLs von der clist-About-Seite kratzen:
library(rvest)url <- "http://www.craigslist.org/about/sites"aboutclist <- read_html(url)aboutclist %>% html_nodes(".colmask:nth-child(4) a") %>% html_attr("href")
Gibt eine Liste von URLs zurück wie:
"//auburn.craigslist.org/" "//bham.craigslist.org/" "//dothan.craigslist.org/" "//shoals.craigslist.org/" "//gadsden.craigslist.org/" "//huntsville.craigslist.org/" "//mobile.craigslist.org/" "//montgomery.craigslist.org/"