Soy el investigador principal de una empresa de corretaje de bienes raíces comerciales. No conozco una fuente perfecta para lo que está buscando, pero aquí hay algunos proxys que puede probar
Opción de pago: Costarhttp://www.costar.com/ tiene algo de lo que desea, pero son un servicio de pago. De vez en cuando he oído hablar de ellos regalando acceso a datos con fines de investigación. No creo que cubran todo Estados Unidos, y solo miran CRE por encima de un cierto tamaño de dólar (algo así como 5 5,000)
Opción gratuita: CraigslistScrape craigslist.org para listados de edificios de oficinas. Las URL son bastante fáciles de generar para el desguace; por ejemplo, puedo descargar los primeros 100 espacios de oficina listados en Nueva York en la URL http://newyork.craigslist.org/search/off
Si agrega»?s=100″ al final de esa URL (es decir, «http://newyork.craigslist.org/search/off?s = 100″), obtienes listados de 100 a 199 de 2500. Cambiando gradualmente el » off?parte s=x», puedes obtener todos los 2500.
Por supuesto, los anuncios c en promedio serán propiedades más pequeñas, pero apuesto a que la cobertura es bastante buena y el sesgo será consistente en todas las geografías.
Actualizar: Raspar todas las URL base de la página acerca de
Si usas R, aquí hay una forma de usar rvest() para raspar todas las URL base de la página acerca de clist:
library(rvest)url <- "http://www.craigslist.org/about/sites"aboutclist <- read_html(url)aboutclist %>% html_nodes(".colmask:nth-child(4) a") %>% html_attr("href")
Devolverá una lista de URL como:
"//auburn.craigslist.org/" "//bham.craigslist.org/" "//dothan.craigslist.org/" "//shoals.craigslist.org/" "//gadsden.craigslist.org/" "//huntsville.craigslist.org/" "//mobile.craigslist.org/" "//montgomery.craigslist.org/"