这个项目是利用机器学习绘制全国每个太阳能电池板的地图。-王其杉博客|程序员|科技新闻
可再生能源是未来的发展方向,但是目前还没有人跟踪谁在屋顶、后院或共享社区安装了太阳能电池板。幸运的是,太阳能电池板在暴露在光线下通常工作得最好。这使得它们很容易从轨道上发现和计数——这正是深太阳能项目正在做的事情。
收集这些信息有许多主动性——一些是有管理的,一些是自愿的,一些是自动的。但是它们都不够全面,也不够精确,不足以将政策或商业决策建立在国家或州一级的基础之上。
斯坦福的工程师(分别是机械的和土木的)阿伦·马朱姆达和拉姆·拉贾戈帕尔决定用现在看来,相当明显的解决方案来解决这个问题。
机器学习系统很擅长于观察图像和寻找经过“训练”能够识别的物体,不管是猫、脸还是汽车……那么为什么不用太阳能电池板呢?
他们的研究小组,包括研究生俞嘉凡和王哲诚,组成了一个图像识别机器学习代理,培训了数十万张卫星图像。该模型学习识别图像中太阳能面板的存在,以及找到这些面板的形状和面积。
在对美国将近10万个随机采样的卫星图像进行评估之后,他们发现,他们获得了大约90%的准确率(稍微多一点或少一点取决于如何测量),这远远领先于其他模型,并且它估计细胞大小的误差只有大约3%。(它的主要缺点是非常小的装置,Rajagopal告诉我,但这部分归因于图像的限制。)
然后,研究小组将模型运用到覆盖下48个州的10亿多个图像瓦片中,以便找到合适的图像。这排除了相当多的面积,但是考虑一下,其中大部分,例如,山脉。那里没有太多的太阳能设施,而且很少有人试图在国家公园安装电池。
总而言之,这大约是实际国家的6%——但是拉贾戈帕尔指出,城市地区只占3.5%,所以这涵盖了所有这些地区,甚至更多。他估计,也许5%的安装是在系统尚未处理的区域(但正在进行中)。
扫描花了整整一个月的时间,但最终,该模型已经发现了147万个单独的太阳能装置(可以是屋顶或整个太阳能农场上的几个面板)。这比其他努力所计算的要多得多,其中最成功的不是像DeepSolar的数据那样提供准确的位置。
这些数据的基本绘图产生了各种有趣的新信息。你可以比较州、县、人口普查区甚至平方英里的太阳能设施密度,并将其与各种其他指标进行比较——平均每年晴天、家庭收入、投票偏好等等。
一些有趣的发现:只有4%的人口普查区域(约占75000人口的3000人)有100多个住宅规模的太阳能系统,这意味着设施高度集中。住宅太阳能占总安装数的87%,但中等尺寸约25平方米,仅占总太阳能电池表面积的34%。
峰值部署密度可以在每平方英里有一千人的地方找到——比如小城镇或郊区,而不是大城市。还有一种拐点,人们开始安装:当一个地区每天接收超过4.5千瓦每平方米的太阳辐射。如何与天气、位置、曝光等对应是一个更复杂的问题。
这些和其他的人口统计信息都是很好的信息,让你知道你是否想投资太阳能,因为它们基本上告诉你在哪里是合理的或需要的。
拉贾戈帕尔说:“我们已经创建并发布了一个网站,你可以在汇总水平上(我们将其保持在人口普查领域水平)玩弄数据,以尊重消费者的隐私。”“我们正在探索如何在尊重隐私的同时(或许通过鼓励公众参与和群众外包)将个人侦查公开。”
“我们决定在开放源码中分享所有的工作,以鼓励工业界和学术界的其他人利用该方法和数据产生更多的见解。我们认为,变化需要迅速发生,这是帮助实现这一目标的方法之一。也许将来,可以围绕这种类型的数据构建服务,”他继续说。
目前正在计划将这项服务扩展到美国其他地区和其他国家。这些数据可以在这里查阅,也可以在这里作为地图查阅;团队的描述该项目的论文今天发表在《焦耳》杂志上。