jsem vedoucí výzkumník pro komerční realitní makléřské firmy. Nevím o ideální zdroj pro to, co hledáte, ale zde jsou některé proxys můžete zkusit
Placené možnosti: Costarhttp://www.costar.com/ má to, co někteří, co chcete, ale jsou to placené služby. Čas od času jsem slyšel o nich darování přístupu k datům pro výzkumné účely. Nemyslím si, že pokrývají celé USA, a oni jen se podívejte na CRE nad určitou dolar velikosti (něco jako $5,000)
Zdarma možnost: CraigslistScrape craigslist.org pro kancelářské budovy výpisy. URL jsou poměrně snadno vytvářet pro vrakování; pro příklad, já si můžete stáhnout prvních 100 kancelářské prostory uvedena v New Yorku na URL http://newyork.craigslist.org/search/off
Pokud přidáte „?s=100 „na konec této adresy URL (tj.“ http://newyork.craigslist.org/search/off?s=100″), dostanete výpisy 100-199 z 2500. Postupnou změnou “ vypnuto?s = X “ část, můžete získat všechny 2500.
samozřejmě, c-výpisy budou v průměru menší vlastnosti, ale vsadím se, že pokrytí je docela dobrý a zkreslení bude konzistentní napříč různými regiony.
Update: Škrábání všechny base URL, z o stránce
Pokud používáte R, tady je způsob, jak používat rvest (), aby skřípání všechny base URL, z clist o stránce:
library(rvest)url <- "http://www.craigslist.org/about/sites"aboutclist <- read_html(url)aboutclist %>% html_nodes(".colmask:nth-child(4) a") %>% html_attr("href")
vrátí seznam URL jako:
"//auburn.craigslist.org/" "//bham.craigslist.org/" "//dothan.craigslist.org/" "//shoals.craigslist.org/" "//gadsden.craigslist.org/" "//huntsville.craigslist.org/" "//mobile.craigslist.org/" "//montgomery.craigslist.org/"