Jeg er leder forsker for en kommerciel ejendomsmæglerfirma. Jeg kender ikke til en perfekt kilde til det, du leder efter, men her er nogle fuldmagter, du måske prøver
betalt mulighed: Costarhttp://
gratis mulighed: CraigslistScrape craigslist.org til kontorbygning lister. URL ‘erne er ret nemme at generere til ophugning; for eksempel kan jeg hente de første 100 kontorlokaler opført i Ny York på URL’ en http://newyork.craigslist.org/search/off
Hvis du tilføjer “?s=100 “til slutningen af denne URL (dvs.”http://newyork.craigslist.org/search/off?s=100”), får du lister 100-199 ud af 2500. Ved trinvist at ændre “off?s= ” del, du kan få alle 2500.
selvfølgelig vil c-lister i gennemsnit være mindre ejendomme, men jeg vedder på, at dækningen er ret god, og bias vil være konsistent på tværs af geografier.
opdatering: skrabning af alle basis-URL ‘er fra siden om
Hvis du bruger R, er her en måde at bruge rvest() til at skrabe alle basis-URL’ er fra clist om-siden:
library(rvest)url <- "http://www.craigslist.org/about/sites"aboutclist <- read_html(url)aboutclist %>% html_nodes(".colmask:nth-child(4) a") %>% html_attr("href")
returnerer en liste over URL ‘ er som:
"//auburn.craigslist.org/" "//bham.craigslist.org/" "//dothan.craigslist.org/" "//shoals.craigslist.org/" "//gadsden.craigslist.org/" "//huntsville.craigslist.org/" "//mobile.craigslist.org/" "//montgomery.craigslist.org/"