2022年简单大气公司名字(2020高端大气公司名称)

上周A16z的future栏目(https://future.a16z.com发表了一篇博客文章-" Data50:The World's Top Data Startups",列出了当今他们认为最好的数据领域的创业公司。让我们看看这些公司都有哪些,以及A16z按照什么标准来进行评价的。在这个名单里,有不少公司我已经在我的公众号介绍过,有些公司我正在计划介绍。

A16Z为什么发布Data50?

A16z发布Data50的背景就跟我们国家大力提倡数字化转型升级一样的原因,就是数据使用的需求越来越强烈。大到国家、政府、大型企业小到刚刚成立的创业公司甚至夫妻老婆店,都有使用数据来帮助自己的诉求。而使用数据的主体也从决策层、数据科学家、数据分析师等逐渐扩散到更多的个体。强烈的需求促进了数据基础设施市场的大规模的发展。在2021年数据基础设施的市场规模占企业基础设施市场规模的五分之一,达到了700亿美金。而这个高速增长的市场也促进了数据技术领域的创新,已经上市的Snowflake和Confluent大大地改变了企业应用数据的情况,现代数据技术栈正在形成郁郁葱葱的数据技术生态。

2021年在现代数据技术领域有超过100亿美金规模的投资,这也是为什么A16z决定发布2022年的数据技术创业公司Data50。这个名单的公司的总估值规模超过了1000亿美金,融资规模超过145亿美金。虽然2022年有很多不确定性,但是数据驱动是一个确定性的趋势,因此相信2022年还会有更多在这个领域的投资,而且名单里很多公司会在2022年IPO。

Data50名单

下面咱们就来看一下这个Data50的名单都有哪些:

  • Top 1 – Top 10
022年简单大气公司名字(2020高端大气公司名称)"

位列前10名的公司大部分是非常有名的公司了,有些公司已经在我的公众号做过详细的介绍。

  1. Databricks-这个公司基本上我不用做什么介绍,虽然还没有上市,不过估值已经超过了300亿美金。在国内做大数据的基本上没有人不知道大名鼎鼎的Spark就是他们家的。先有了Spark,才有了后来的Databricks这个公司。出自名门伯克利的amplab,大数据行业的扛把子。国内众多做湖仓一体的公司都想学习Databricks。Databricks大概率今年会上市,看看后续二级市场的表现。
  2. Fivetran-这个可以看我的文章估值56亿美金的独角兽Fivetran – 重新定义数据流
  3. Scale AI-这个是一个提供数据科学平台和训练数据的公司,2016年成立,目前总融资规模超过6亿美金,公司估值超过50亿美金。可以类比的是国内的类似于倍赛这样的数据标注的公司。
  4. OneTrust-这个公司是一个做数据安全和数据治理的公司,成立于2016年。我在2018年自己做数据安全产品的时候研究过他们,没想到现在总融资额已经超过了9亿美金,估值超过50亿美金
  5. Dbt-这个是我自己非常喜欢的一家公司,我们现在做的产品和dbt要解决的问题是类似的,只是面向的人群不同。数据建模以及数据整理是使用数据环节中最耗费人力的一环。Dbt从SQL工程化、模块化、协同入手解决分析工程师的问题。关于dbt,可以看海外数据转换工具独角兽 – dbt labs
  6. Starburst-关于Starburst,我也专门写过一篇文章。融资2.5亿美金, 估值33.5亿美金,Starburst继续爆发。
  7. Collibra-这是一家成立于比利时的数据治理和数据集成的公司,公司成立于2008年,公司产品涉及了数据治理相关(数据目录、数据隐私、数据血缘、数据治理、数据质量)的所有链条,而且目前支持云。算是欧洲非常成功的数据技术公司之一,融资规模接近6亿,公司估值超过50亿美金。
  8. Dremio-现在把自己定位为一家湖仓公司,提供了类似于Starburst的能跨数据湖进行SQL访问的引擎。成立于2015年,融资规模超过4亿美金,今年最新估值在20亿美金左右。
  9. Dataiku-这个产品更是一个非常熟悉的产品。最早成立于法国,现在已经将主要的部分放到了美国,一个All in One的数据科学平台。成立于2013年,融资超过6亿美金,上一轮融资的投后估值在46亿美金。
  10. Hugging Face-这个公司我第一次听说,是一个开源的数据科学平台和社区。成立于2016年,融资6000万美金,估值在4亿美金左右。
  • Top 11 – Top 20
022年简单大气公司名字(2020高端大气公司名称)"

在11到20名的公司里我比较熟悉的是DataRobot,Firebolt, Astronomer, Alation, Sigma Computing和Monte Carlo,其余的几个则没有那么了解。

11. DataRobot-这家公司属于AI领域非常知名的公司,成立于2012年。最初是提供自动机器学习模型训练的平台,然后通过一系列的发展并购,目前定位于提供AI云平台的企业。总体融资规模达到10亿美金,估值也已经超过了60亿美金。国内做AI平台的第四范式则基于中国国情,走了另外一条服务、硬件、咨询、平台的路线。

12. Primer-这也是一家AI公司,提供利用AI能力帮助客户进行文本内容挖掘的服务,可以直观的理解为NLP As a Service。总融资规模为1.68亿美金,估值大约为5亿美金。

13. Snorkel-这是一家2019年才成立的AI平台公司,也是做数据标注的。不过相对于传统的手工标注,Snorkel提供的是程序自动化标注平台,这样训练数据标注、模型训练、模型部署、效果反馈然后再自动标注整个反馈loop就形成了,听起来非常的美好。现在已经融资超过1.35亿美金,估值更是超过10亿美金。

14. Anyscale-又是一家AI平台公司,也是2019年成立。这个是解决AI最后一公里问题的公司。仔细看他们家的技术,才发现是做Ray这个伯克利RiseLab开源的产品商业化的公司,难怪短短两年时间就融资超过1.6亿,估值超过10亿美金。毕竟伯克利这个团队孵化出来了Databricks以及Alluxio,在AI大规模运行方面赌Ray应该有比较大概率成功。

15. Firebolt-这个是由Sisence的CTO在以色列创立的一家大数据平台公司,主打的是在大规模数据分析场景下的性能,魔改了国内非常知名的由俄罗斯的Yandex开源的clickhouse。2019年成立,到目前已经融资超过2.6亿美金,估值达到14亿美金。

16. Astronomer-这个是国外最知名的流程调度开源产品Airflow商业化的公司,主要提供云上基于Airflow的调度。成立于2015年,在上周刚刚融资2.13亿美金,融资总规模达到了2.83亿美金,估值也超过了10亿美金。希望国产的开源DolphinScheduler能赶超它,郭大侠加油!

17. Alation-一个非常熟悉的名字,在2016年就调研过它。这是个成立于2012年的做数据治理的公司,发展到今天融资接近2亿美金,估值12亿美金。

18. Weights&BIases-这也是一家AI平台公司,主要面向的是AI开发者,提供一个开发者优先的MLops平台。可以帮助机器学习开发者管理数据集、模型效果以及自动模型训练,并且支持协作、版本等等。公司在2018年成立,总融资规模两亿美金,估值超过10亿美金。

19.Sigma Computing-这是一家在云上进行BI分析的公司,利用用户比较熟悉的spreadsheet的UI表现形式,进行多维分析以及数据可视化。公司成立于2014年,总融资规模超过3.8亿美金,估值超过10亿美金。

20. Monte Carlo-这是一家数据可观测性公司,2019年成立,融资规模超过一亿美金,估值接近10亿美金。

  • Top 21- Top30
022年简单大气公司名字(2020高端大气公司名称)"

21. OctoML-这也是一家解决数据科学最后一公里问题的公司,帮助做机器学习模型的部署。是Apache开源项目TVM的商业化公司。支持多云,多种机器学习框架。公司成立于2019年,已经融资超过1.3亿美金,估值也接近10亿美金。随着机器学习和AI与行业结合得越来越紧密,解决数据科学工程化、部署以及运维的平台公司也越来越多。

22. Census-这是近几年出现的的反向ETL的公司之一,2018年成立,融资总额超过了8000万美金,估值也逼近10亿美金。相关的介绍可以看公众号文章反向ETL(Reverse ETL)以及相关的公司

23. Hex-这家公司是主打协同和知识分享的数据科学平台,成立于2019年,刚刚完成自己的B轮融资5200万美金的融资,总融资规模超过7000万,估值估计在5亿美金左右。

24. Hightough-这个公司跟Census一样,也是做反向ETL的,同样也是成立于2018年,两个公司属于完全的竞争对手。总融资规模达到了5200万美金,估值差不多5亿,在文章反向ETL(Reverse ETL)以及相关的公司也有介绍。

25. Amperity-一个成立于2016年的做CDP的公司,采用AI技术进行客户数据的集成、挖掘和管理。总融资额达到了1.87亿美金,估值超过10亿美金。

26. BigID-我在2017年曾经调研过的一家公司,成立于2016年。做数据隐私和数据治理的公司,融资总额超过了1.6亿美金,估值超过12亿美金。

27. Privacera-这个公司也是做数据安全和数据治理的公司,成立于2016年。总融资额6800万美金,估值在5亿美金左右。

28. Immuta-也是做数据安全和数据治理的公司,侧重在云上数据的访问控制。成立于2015年,我在做数据安全产品的时候也调研过他们家。现在总融资额1.69亿美金,估值在5亿美金左右。

29. Bigeye-这个是做数据可观测性的公司,与Monte Carlo做的事情一样。更多信息参看数据可观测性和相关的公司

30. Matillion-这是在欧洲成立的一家做数据集成的公司,跟Fivetran是竞争对手,也是一家独角兽公司。2011年成立,总融资额达到了3.1亿美金,估值超过15亿美金。

  • Top 31 – Top 40
022年简单大气公司名字(2020高端大气公司名称)"

31. Heap – Heap Analytics做的事情跟我曾经服务过的TalkingData的统计分析平台类似,提供的是用户分析相关的SaaS服务。最早的无埋点技术应该就是来自于他们家。Heap成立于2013年,总融资规模超过2亿美金,估值在10亿美金上下。

32. Tecton-这是一家做模型特征管理平台的公司,主要服务于数据科学团队进行特征的管理,应该是这个领域最为头部的公司了。公司成立于2019年,总融资规模6000万美金,估值大约在4亿美金左右。我有个师弟正在这个方向进行创业。

33. Imply – 开源数仓引擎Druid的商业化公司,是华人创业的大数据公司。曾经有幸邀请过Imply创始人杨仿金参加过活动,那时候他刚刚成立Imply。Imply在2015年创立,目前融资总额1.15亿美金,估值7亿美金。

34. Sisu Data – Sisu Data是一家决策智能引擎公司,可以自动分析指标相关的数据特征,从而能够帮助决策。公司成立于2018年,总融资额1.28亿美金,估值大约在6亿美金左右。

35. RudderStack – 一个面向工程师的开源CDP平台,具体可以参看给工程师的CDP – 开源CDP厂商RudderStack。

36. ActionIQ – 也是一个CDP平台公司,成立于2014年,总融资额超过1.4亿美金,估值接近10亿美金。

37. Clickhouse – 国内大数据圈已经非常有名的产品了,最早是俄罗斯搜索引擎公司开源的大数据分析平台。2021年开始成立商业公司进行商业化,两轮融资就拿到了3亿美金,目前估值已经超过20亿美金。

38. Airbyte – Fivetrans的开源竞争版本,具体可以阅读公众号文章不让Fivetran独美,Airbyte新晋独角兽

39. Rockset – 一个在云上做大数据实时分析的公司,公司团队核心成员参与过HDFS, Rocksdb等等的开发。公司成立于2016年,总融资规模6000多万美金,估值在4亿美金左右。

40. LabelBox – 与Snorkel类似,都是做数据标注相关的平台。公司于2017年成立,总融资额达到1.89亿美金,估值10亿美金。

  • Top 41-Top 50
022年简单大气公司名字(2020高端大气公司名称)"

各个分类的表现

在Data50里边, A16z把产品分为了7个大类,分别是Query&Processing, AI/ML, ELT&Orchestration, Data Goverance&Security, Customer Data Analytics, BI&Notebook, Data Observerbility。7个大类的公司分布如下:

022年简单大气公司名字(2020高端大气公司名称)"

按照公司数量进行统计,如下图:

022年简单大气公司名字(2020高端大气公司名称)"

AI/ML的公司数量最多,主要还是过去几年AI持续火热,另外AI也在从互联网公司开始辐射到更多不同类型的企业,解决AI最后一公里的问题以及工程化的问题就成了必须。而数据越来越多,核心的数据基础设施Query&Porcessing的公司也有不少,但是也在不同的细分。然后是ELT以及数据流程调度、数据治理和数据安全、客户数据分析。这几个分类都是在数据使用环节中,解决数据使用环节中的不同问题,都有足够大的市场机会。数据可观测性还处于早期,BI则因为现在企业用数据的场景在多元化,因此公司数量相对较少。

我们再来看看融资额度按照分类的占比:

022年简单大气公司名字(2020高端大气公司名称)"

数据查询和处理占据了融资额度的半壁江山,主要原因是这个领域里几位选手都已经是大型独角兽了,Databricks自不用说,Dataiku、DataRobot、Clickhouse、Firebolt也都达到了几十亿美金的估值,这个领域里准上市公司是最多的公司。AI/ML领域则数量取胜占据第二位。Data Goverance&Security, ELT&Ochestration这两个分类融资也比较接近,属于市场还在成长期,预计未来还会有更多的公司和资金进入。

下面我们再看看国家地域的分布:

022年简单大气公司名字(2020高端大气公司名称)"

可以看到大部分的公司都集中在硅谷周边,然后美国东部波士顿附近、欧洲也有一些公司。非常遗憾的是这里边没有一个中国和亚洲公司。中国本土在前年到去年因为Snowflake的原因,有很多资金投入到了Data Query和Processing领域,希望未来有公司能够进入到世界的前列。也希望我们自己的产品在未来几年能够在欧美站稳脚步,并且进入到这个名单中。

接下来看看这些公司成立的时间:

022年简单大气公司名字(2020高端大气公司名称)"

我们可以看到大部分的公司都是成立于2024年之后,其中2019年成立的公司最多。AI的成熟促进了2019年大量AI/ML工程化相关的公司成立。遥想2019年我们几个朋友私下聊天,还想AI工程化应该是个未来的机会,美国市场证明了我们的想法。而数据查询和处理相关的公司则分布比较均匀,毕竟数据计算是核心的诉求,而公有云上做数据处理必然是一直存在的趋势。ELT&Orchestration最近几年也有不少公司成立,核心还是在云上数据建模、清洗和数据流调度正在成为刚需。

再看看按年的投资情况:

022年简单大气公司名字(2020高端大气公司名称)"

从这张图可以看到,从2019年,数据领域的投资开始增加,然后2020年基本维持在2019年的水准,然后2021年投资额相对2020年基本上翻了3倍多,2022年刚刚一个季度,投资额就已经接近2020年的全年的水准了。这里虽然有美国放水资金充裕的原因,另外一个重要的原因是投资商都认可未来10年是真正的数据的10年,通过过去这些年的数据使用的探索,社会的方方面面未来都是数据驱动的,而支撑数据驱动的必然是这些科技公司的产品。

总结一下

看完了这个榜单,还是有些羡慕美国的生态的。由于自己也在从事数据工具方面的创业,最近半年多一直也在关注美国的现代数据技术栈。现在A16z做的这个总结很全面,从这些公司看,在数据技术领域,美国这些创业公司跟在垂直业务领域的SaaS公司走的路线很接近,都是找一个问题点,去解决过去解决不好的问题。由于周边生态完备,大家都很容易跟周边生态一起结合,然后去服务客户。

这些公司无论大小,只要能解决问题解决得好,就会有客户买单。这样,所有的公司都不需要把自己做成大而全的公司,很多公司现在的规模都不到100人,甚至不到50人,但是公司已经进入快速发展到快车道。从退出通道来讲,海外正是因为有生态,这些公司退出通道也更多元,IPO,被收购等等。当然,最近接触了一些同样在创业的创业者,大家现在心态上也更务实了,越来越多的创业者都更重视产品,重视最终用户。相信对用户有价值的产品,最终能够在市场上证明自己。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 sumchina520@foxmail.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.shangmengchina.com/26779.html