én vagyok a vezető kutató egy irodai ingatlan brókercég. Nem tudom, a tökéletes forrás, amit keres, de itt van néhány proxy lehet próbálni
fizetett opció: Costarhttp://www.costar.com/ van, amit néhány, amit akarsz, de ők egy fizetős szolgáltatás. Időről időre hallottam róluk ajándékozás adathozzáférés kutatási célokra. Nem hiszem, hogy az egész USA-t lefedik, és csak a CRE-t nézik egy bizonyos dollárméret felett (olyasmi, mint $5,000)
ingyenes opció: CraigslistScrape craigslist.org az irodaház listák. Az URL-ek viszonylag könnyen létre a selejtezési; például nem letölthető, az első 100 irodát felsorolt New Yorkban az URL http://newyork.craigslist.org/search/off
Ha hozzá “?s=100 “az URL végéig (azaz” http://newyork.craigslist.org/search/off?s=100″), akkor kap listák 100-199 ki 2500. Azáltal, hogy fokozatosan megváltoztatja a ” ki?s=x” rész, akkor kap minden 2500.
természetesen a C-listák átlagosan kisebb tulajdonságok lesznek, de fogadok, hogy a lefedettség elég jó, és az elfogultság következetes lesz a földrajzok között.
frissítés: az összes alap URL lekaparása a Névjegy oldalról
Ha R-t használ, itt van egy módja annak, hogy az rvest() segítségével az összes alap URL-t lekaparja az oldalról:
library(rvest)url <- "http://www.craigslist.org/about/sites"aboutclist <- read_html(url)aboutclist %>% html_nodes(".colmask:nth-child(4) a") %>% html_attr("href")
visszaadja az URL-ek listáját:
"//auburn.craigslist.org/" "//bham.craigslist.org/" "//dothan.craigslist.org/" "//shoals.craigslist.org/" "//gadsden.craigslist.org/" "//huntsville.craigslist.org/" "//mobile.craigslist.org/" "//montgomery.craigslist.org/"