Je suis chercheur principal pour une société de courtage immobilier commercial. Je ne connais pas de source parfaite pour ce que vous recherchez, mais voici quelques proxys que vous pourriez essayer
Option payante: Costarhttp://www.costar.com/ a ce que vous voulez, mais c’est un service payant. De temps en temps, j’ai entendu parler d’eux qui donnaient l’accès aux données à des fins de recherche. Je ne pense pas qu’ils couvrent l’ensemble des États-Unis, et ils ne regardent que le CRE au-dessus d’une certaine taille de dollar (quelque chose comme 5 000 $)
Option gratuite: CraigslistScrape craigslist.org pour les annonces d’immeubles de bureaux. Les URL sont assez faciles à générer pour la mise au rebut; par exemple, je peux télécharger les 100 premiers espaces de bureau répertoriés à New York à l’URL http://newyork.craigslist.org/search/off
Si vous ajoutez « ?s=100 » à la fin de cette URL (c’est-à-dire « http://newyork.craigslist.org/search/off?s = 100 »), vous obtenez des listes 100-199 sur 2500. En changeant progressivement le « off?s = x » partie, vous pouvez obtenir tous les 2500.
Bien sûr, les annonces c seront en moyenne des propriétés plus petites, mais je parie que la couverture est plutôt bonne et que le biais sera cohérent d’une région géographique à l’autre.
Mise à jour: Grattage de toutes les URL de base de la page à propos
Si vous utilisez R, voici un moyen d’utiliser rvest() pour gratter toutes les URL de base de la clist à propos de la page:
library(rvest)url <- "http://www.craigslist.org/about/sites"aboutclist <- read_html(url)aboutclist %>% html_nodes(".colmask:nth-child(4) a") %>% html_attr("href")
Retournera une liste d’URL comme:
"//auburn.craigslist.org/" "//bham.craigslist.org/" "//dothan.craigslist.org/" "//shoals.craigslist.org/" "//gadsden.craigslist.org/" "//huntsville.craigslist.org/" "//mobile.craigslist.org/" "//montgomery.craigslist.org/"