在“大数据”概念诞生十多年后,数据仍然是大型企业和初创企业中最重要、增长最迅猛的创新驱动因素之一。从提供作为商业运作基础的脉搏检查,到通过机器学习实现日常任务的智能自动化,数据已经成为各种规模组织决策的中枢神经系统。此外,数据的使用已经远远超出了数据科学家、数据分析师和数据工程师的范畴—每个人都是数据生产者和消费者。
这种对数据更加关注的结果是:数据管理业务已经成为基础设施增长最快的领域之一,据估计价值超过700亿美元,占2021年所有企业基础设施支出的五分之一以上。这个市场形成的原因在于,它结合了软件工程、分析和人工智能领域,同时顺应了云计算的潮流势头。
过去几年,数据行业的发展也催生了一些令人兴奋和有影响力的企业软件公司。最近,Snowflake和Confluent等公共巨头已经改变了数千家企业的运营方式和数百万种产品的生产方式。然而,大多数人都不太熟悉那些有影响力的公司,也就是下一代定义类别的公司。
2021年,数据公司获得了数百亿美元的风险投资,打破了历史记录,2022年的风险投资也已经很强劲。我们编制了Data50的首批数据。这些是令人兴奋的数据类别中的领头羊公司。总体而言,这50家公司的价值超过1000亿美元,并且筹集了大约145亿美元的总资本,其中20家到2021年已达到独角兽地位。
金色财经行情播报丨BTC晚间小幅震荡整理 回调区间被逐步收复:据火币行情显示,比特币昨日晚间持续在11,550USDT一线横盘整理,早间突破了11,600USDT。比特币近期在高位出现了几次波动整理,逐步释放了前期快速拉升带来的短期回调压力。昨夜黄金市场仍然出现了一些波动,但是比特币市场并没有出现很相关的行情,市场内的短期避险资金可能已经离场,中长期上市趋势仍在持续。短期内市场驱动力可能会逐步回归加密数字市场本身的热点,因此需要关注BTC和ETH可能形成的关联走势。短期内比特币震荡区间在11,200-11,700USDT。截至10:00,主流币的具体表现如下:[2020/8/13]
Data50公司涵盖类型有7个子类别:
AI/ML、BI&Notebooks、CustomerDataAnalytics、DataGovernance&Security、DataObservability、ELT&Orchestration、QueryandProcessing。
金色晚报 | 6月7日晚间重要动态一览:12:00-21:00关键词:新冠肺炎、ETH非零地址、市场操纵
1.全球新冠肺炎确诊病例累计超700万例。
2.ETH非零地址数量再次刷新历史新高。
3.2020年因犯罪被盗加密货币总值可能将接近45亿美元。
4.24小时合约市场爆仓超2022万美元。
5.报告:大额比特币转账并不意味着市场操纵。
6.风险投资家:在下一轮牛市中ETH表现将超过BTC。
7.孙宇晨公开信:波场TRON将于7月7日完成TRON4.0升级。
8.比特币小幅下跌,日内最高报9722.47美元,最低报9482美元。[2020/6/7]
1、查询和处理技术是访问、聚合和计算数据的核心引擎。它涉及两大类:批处理和实时处理。在过去的几年里,由于对实时应用程序的需求不断增加,后者得到了越来越多的关注。
2、AI/ML包括应用算法建模和机器学习处理大规模数据的软件。从上榜公司的数量来看,这一领域正在成熟和繁荣。一些参与者专注于一个特定类型的数据(例如自然语言的Rasa和HuggingFace),而另一些则专注于不同的领域,例如AI的产品化或充当用于运行AI工作负载的“计算层”。
金色晨讯丨4月28日隔夜重要动态一览:21:00-7:00关键词:新冠肺炎、区块链应用、USDT增发
1.美国新冠肺炎确诊病例数超100万例。
2.人民日报:运用区块链等前沿技术可推动城市管理创新。
3.经济日报:应大力推动区块链等与贸易有机融合。
4.CME比特币期货5月合约收涨2.44%。
5.Tether向以太坊网络增发1.2亿枚USDT(已授权未发行)。
6.美国运输部:区块链有助于商业无人机交付。
7.DASH减产后出块稳定 区块奖励已降至2.89DASH。
8.外媒:规模小的比特币矿工或在减半后无法生存。
9.比特币小幅震荡,日内最高报7774.28美元,最低报7640.39美元。[2020/4/28]
3、ELT和编排支持数据的移动。它是保证数据准确、准时到达目的地的传输层。此类别是从传统的ETL供应商演化而来的。另一方面,新类别的玩家大多是云原生的,对开发人员友好,并且可以处理不同数据环境之间更复杂的依赖关系。
4、随着数据堆栈变得越来越复杂并且涉及更多利益相关者,数据治理和安全性正成为关键问题。需要治理工具—尤其是在高度规范的行业—来确保数据的安全并在整个数据生命周期中保持一致性。这一类别相对较新,通常服务于受监管的大型企业公司。
金色晨讯 | 以太坊君士坦丁堡升级因“可重入”漏洞延期 51%双花攻击所得的ETC已归还完毕:1.南非或将开始跟踪加密货币交易。
2.以太坊君士坦丁堡升级因“可重入”漏洞延期。
3.美国立法者提出新法案 为部分加密初创公司提供“安全港”。
4.2018年中国区块链专利申请量领跑全球 达到2913件。
5.保加利亚政府对加密货币交易利润征收10%的税款。
6.IBM使用区块链平台跟踪金属行业的供应链。
7.印度政府将于1月17日批准创业激励计划并与区块链基金会合作。
8.慢雾: 51%双花攻击所得的所有ETC已归还完毕。
9.Ripple:仅2015年8月之前的私钥易受攻击。[2019/1/17]
5、传统上,客户数据分析由营销团队负责。然而,由于其重要性日益增加,数据团队现在更多地参与将客户数据与中央数据平台集成。此类别侧重于捕获客户数据或操作该数据以服务于一线业务用例。
6、BI¬ebooks覆盖了数据的消费层。尽管它是一个成熟的类别,但Preset或Metabase等新参与者正在采取开源优先的方法,并吸引技术数据工程师以及商业智能团队。数据需求的快速变化性质也对迭代和交互式笔记本和自动洞察生成产生了更多需求。
分析 | 金色盘面:QTUM/USDT 持续下跌:金色盘面综合分析:QTUM/USDT4小时K线走出持续调整的形态,指标显示跌势尚未结束,且没有技术背离形成,短线维持观望,压力位MA6。[2018/8/9]
数据可观察性从软件工程堆栈的最佳实践中汲取灵感。随着数据堆栈越来越依赖于上下游工具,并且数据的准确性具有更广泛的影响,可观察性成为提供跨数据流监控和诊断能力的最新类别。
尽管市场采用的主要推动力是数据量和使用量的增加,但每个类别的潜在驱动力是不同的。例如,查询和处理领域的进步主要是由计算和存储的分离、迁移到云以及更廉价的计算能力驱动的。与此同时,在数据治理和数据可观察性中采用操作性工具在很大程度上是由不断增长的操作性用例和数据工作流的复杂性驱动的。
以下为Data50公司名单:
从细分角度看Data50:
查询和处理公司筹集了最大的资本份额
查询和处理类别只占Data50中公司的五分之一,但投资在这一类别的资金数额是惊人的。尽管这一数据受到了Databricks最近16亿美元融资的影响,但如果没有它,这一类别仍将占所有融资的37%,是下一个类别的两倍多。
从公司数量来看,分布更为均衡。就公司数量而言,AI/ML是最大的类别,主要是因为该领域仍在不断发展,需要一套新的独立工具来训练、测量和生产模型。
Data50集中在旧金山湾区
在这50家公司中,47家位于美国,3家是跨国公司。其中33家公司位于旧金山湾区,9家位于华盛顿特区、费城、纽约和波士顿的I-95走廊沿线。其中两家位于西雅图,一家位于辛辛那提,还有一家位于亚特兰大。
这种分布受到大规模数据生态系统历史位置的严重影响。然而,我们看到越来越多的数据公司出现在全球各地,因为数据工程人才和对数据工具的需求几乎遍及每个大陆。
AI/ML类别推动了2019年新数据公司的激增
大多数Data50公司成立于2014年之后,在AI/ML工具爆炸式增长的推动下,在2019年左右达到顶峰。事实上,2019年之后成立了更多的数据公司,但是因为我们关注的是已经达到一定规模的公司,所以大多数新公司还没有出现在这个名单上。
每个类别的投资都在增长
从每个类别的投资来看,最显着的趋势是AI/ML公司比以往任何时候都获得了更多的投资者兴趣,主要集中在早期阶段。ELT和编排也是如此——主要由来自Fivetran和dbt的巨轮驱动。查询和处理公司继续吸引大笔资金,尽管这些公司往往处于后期阶段。
本文作者为JenniferLi、SarahWang、JamieSullivan。JenniferLi是a16z的合伙人,她专注于企业公司。SarahWang是a16z的普通合伙人,专注于成长阶段的投资。JamieSullivan是a16zGrowth投资团队的合伙人,专注于消费者、企业和金融科技领域的后期公司。
在本文结尾,作者指出,我们坚信,未来10年将是数据的十年,包括基础设施、应用程序以及介于两者之间的一切。因此,我们将继续看到创纪录的增长、资金和市值,我们将在此列表中每年对其进行跟踪。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。