ceny komerčních nemovitostí (kancelářské prostory) na zip kódu

jsem vedoucí výzkumník pro komerční realitní makléřské firmy. Nevím o ideální zdroj pro to, co hledáte, ale zde jsou některé proxys můžete zkusit

Placené možnosti: Costarhttp://www.costar.com/ má to, co někteří, co chcete, ale jsou to placené služby. Čas od času jsem slyšel o nich darování přístupu k datům pro výzkumné účely. Nemyslím si, že pokrývají celé USA, a oni jen se podívejte na CRE nad určitou dolar velikosti (něco jako $5,000)

Zdarma možnost: CraigslistScrape craigslist.org pro kancelářské budovy výpisy. URL jsou poměrně snadno vytvářet pro vrakování; pro příklad, já si můžete stáhnout prvních 100 kancelářské prostory uvedena v New Yorku na URL http://newyork.craigslist.org/search/off

Pokud přidáte „?s=100 „na konec této adresy URL (tj.“ http://newyork.craigslist.org/search/off?s=100″), dostanete výpisy 100-199 z 2500. Postupnou změnou “ vypnuto?s = X “ část, můžete získat všechny 2500.

samozřejmě, c-výpisy budou v průměru menší vlastnosti, ale vsadím se, že pokrytí je docela dobrý a zkreslení bude konzistentní napříč různými regiony.

Update: Škrábání všechny base URL, z o stránce

Pokud používáte R, tady je způsob, jak používat rvest (), aby skřípání všechny base URL, z clist o stránce:

library(rvest)url <- "http://www.craigslist.org/about/sites"aboutclist <- read_html(url)aboutclist %>% html_nodes(".colmask:nth-child(4) a") %>% html_attr("href")

vrátí seznam URL jako:

 "//auburn.craigslist.org/" "//bham.craigslist.org/" "//dothan.craigslist.org/" "//shoals.craigslist.org/" "//gadsden.craigslist.org/" "//huntsville.craigslist.org/" "//mobile.craigslist.org/" "//montgomery.craigslist.org/" 

Related Posts

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *