文|冯玮
在线中文分级阅读平台考拉阅读宣布已完成2000万美元B轮融资,由GGV纪源资本及XVC共同领投,启明创投及CMC华人文化产业基金跟投。
据了解,考拉阅读日活已接近100万,用户平均阅读时长为30分钟,考拉CEO赵梓淳透露,藉由用户数据积累与资本的推动,考拉阅读一方面会继续迭代底层技术,另一方面将与高等院校及权威机构合作,结合用户数据推动深层研究。
考拉阅读成立于2016年9月,并于2017年6月推出第一版在线分级阅读产品,在考拉即将迎来两周年之际,赵梓淳也分享了属于考拉的新变化。
(考拉阅读的创始人、CEO赵梓淳)
产品2.0时期:阅读数据或成为考拉壁垒
赵梓淳曾在美国读书,期间受国外分级新闻阅读产品“Newsela”的启发,便开始思考能否将国外的分级阅读理念带入中国。
“那时蓝思分级和 Renaissance 的ATOS 分级测评体系都已经被国外认可且广泛应用,差不多比我们领先了40年。我想做的,就是结合中国文字的实际情况,推出一套中文分级阅读体系(ER Framework)。”赵梓淳回忆。
据了解,ER Framework可测量任意中文文本的阅读难度值,在200ER-1300ER区间,数字越大,难度越高,而ER值同时可作为衡量学员阅读能力水平的标准。
从产品逻辑来看,考拉就是通过ER Framework,从阅读前期的阅读能力评定到书目推荐再到后期的阅读水平考核,帮助学生在阅读的各个环节实现个性化阅读。
赵梓淳进一步介绍,与AlphaGo训练CNN策略网络需要大量高手对弈盘面数据作为训练输入相似,考拉阅读ER Framework采用了大规模、通过语言学及心理学专家标注的中文分级语料数据。
其将大量精细化处理的非平衡中文分级语料作为输入,结构化的字词句段篇特征作为输出,训练出深层CNN ResNet以及多层次Bi-LSTM相结合的认知语义理解网络。
接着通过已完成初步训练的网络,处理更大规模的海量平衡语料(类似于AlphaGo的自我博弈过程),采用弱监督学习和迁移学习的方式,有效地利用了更大规模的半结构化数据。
再经过专家反复评估校正标注质量,将“一精一大”语料进行整合,加强了深度学习网络训练的充分性和预测的准确性。
2017年11月,考拉阅读联合教育部基础教育质量监测中心和国家语委汉语智能教育中心对一到四线的三十余万中国学生开展了阅读能力信息采集,赵梓淳对多知网表示,今年的学生采集数据已达到六十万,而这些数据也成为考拉2.0产品阶段的核心力量之一。
“我们之前的产品算是考拉阅读的1.0版本,它主要通过专家经验,结合多学科理论得出推荐模型,是相对静态的逻辑。”
“我们的产品是让孩子的阅读能力与文本难度进行适配,这中间很容易有偏差。比如文本本身难度偏高,但孩子在实际做题的时候却可以答得又快又好,那有可能是作者的语言风格或者这篇文字的背景知识与孩子的积累有结合。因此,大量的学生真实数据就显得格外重要。”
“而随着六十万学生选择在平台上进行阅读以及其每日平均三十分钟的阅读习惯,我们拿到了更多涵盖阅读到练习的动态数据。”
赵梓淳继续解读:“这些数据一方面可以为自身产品做校验,弥补数据维度缺失,进而做出更精准的推荐模型;另一方面可以与相关机构达成合作,我们的数据积累是研究过程中十分重要的基础环节。”
但除此之外,赵梓淳也清楚单凭数据的力量还不足以帮助考拉阅读走得更稳妥。
公立校是阅读产品的最好入口?
据了解,考拉阅读目前主要与B端合作,已进入几千所公立学校,且均为免费。
在现阶段,暂不考虑变现的考拉阅读选择B端也有其深层逻辑,在某次采访中,赵梓淳曾这样解读:
“现在To C的少儿阅读产品挺多,大多是通过打造IP,购买版权内容,吸引大量用户,赶快收费。我觉得这样的商业模式没有什么问题,但我们选择的路不太一样,可以说我们的野心更大一些。”
首先,考拉阅读想确立中文分级阅读标准,做一套中国版的蓝思分级系统。而这套标准想要得到社会认可,就需要公立学校来做信任背书。所以,考拉阅读选择从To B切入来解决公信力的问题。
其次,教育产品的用户和消费产品的用户不一样,学生用户随着年龄的增长,天然就要流失,所以纯To C的商业模式注定企业必须快速变现,否则获取的大量用户是没有意义的。
基于此,赵梓淳对多知网也做了进一步的解释:“面对必然会流失的流量和必然会长高的成本,B端就是流量抓取的关键。”
另据了解,考拉阅读基于公立校阅读数据,将于近期推出《中国学生大数据阅读报告》(暂定名)。
白皮书中指出,孩子的阅读能力与所在城市的经济水平正相关,一二线城市各年级能力ER值均高于四五线城市,一二线城市三年级学生平均水平已经剑姬无线城市四年级平均水平。
但是,各线城市中成绩靠前的学校间并没有明显差异,五线城市的县级小学中,也有能力不输于一线城市排名靠前的学校,如山西省忻州市五台县实验小学。
另外在男生和女生的对比中来看,同年级的女生阅读能力高于男生,且在六年级差异最为明显,相当于领先三个月的学习时间;但在其他年级,男生超过女生的情况集中在一二线城市的低年级。
赵梓淳表示,公立校数据的整合将有助于其接下来为学校提供的个性化推荐,他也透露,未来不排除将把目前用户群体转向C端,提供自适应阅读系统,同时也可能尝试类似kindle的阅读硬件产品。
当大语文渐入佳境,“大阅读”繁荣还有多远?
赵梓淳透露,近半年考拉日活用户激增,短期内从3000增长至100万,而这背后主要有四方面原因。
其一、政策向导。
前有书香中国、书香校园的推动,后有新高考改革对阅读能力的关注,以应试为向导,以校园活动为支撑,都让公立校对阅读产品的拥抱度逐渐增长。
随着一批机构对大语文产品的拥趸,自然也会为语文品类中的阅读产品带来积极的推动作用。
其二、在线教育热。
“阅读离应试可能很远。但现在家长都很焦虑,他们自己看书看不进去,就用“得到”,20分钟听完。这种焦虑会传给孩子,他们的孩子也要看书阅读,你说是不是刚需?”赵梓淳曾这样解读。
而随着在线教育模式的普及和推广,令在线阅读类产品的使用度开始提升。
其三、家长理念变化。
随着80、90后家长成为K12阶段家长主流人群,这个阶段家长对知识的付费意愿也更加灵活,区别于曾经的学好数理化,现在的家长会关注孩子的综合能力。
家庭层面对孩子的阅读能力培养也开始从胎教贯穿至整个成长周期。
其四、产品逻辑。
“语文学习是一个很感性的东西,之前主要是老师或者长辈、同学间的内容分享和自我感知,那么怎么把语文能力、阅读能力进行量化评估,此外如何基于学生情况去进行个性化推荐,帮助孩子在阅读上可以循序渐进一直都是一个问题。”
赵梓淳表示,基于这些需求,考拉阅读帮助那些希望阅读能力提升但是不知道如何选内容以及真实了解阅读状态的家庭,提供理性产品。
除此之外,赵梓淳认为之所以资本市场开始关注并推动阅读类产品的发展,或许也是其认为少儿阅读领域有需要变革的地方,它带来的商业价值将会可期。
前几天赵梓淳收到条语音,一个二年级小男孩儿奶声奶气慢悠悠地说:“我特别喜欢考拉博士,考拉博士让我比其他小朋友厉害好多呀!”
他说自己听了好几遍,那是打心眼里让他觉得有成就感的事儿。