Hi there, I’m Boyan. 👋

Building a venture @Requo Inc. @NYU Tandon & @NYU Shanghai Alumni.

Knowledge Economy

Computers created the economy around knowledge. While the Internet has cheapened knowledge’s access, LLM will cheapen its consumption and application. Roles Here is the landscape of the knowledge economy: Knowledge consumers: the users, including all sorts of readers. They access, consume, and apply existing knowledge. Knowledge producers: the suppliers, including all sorts of writers. They produce new knowledge. Knowledge workers: the knowers and appliers, including all sorts of experts. They apply professional knowledge on their clients’ behalf, the candidacy of which requires years of training. Knowledge tailors: the knowers, but not the appliers, including all sorts of consultants. They customize the presentation of knowledge according to their customers’ background, making the value more affordable (in time) to consume. Knowledge brokers: the resellers, including all sorts of institutions. They manage the business side of knowledge transaction, like distribution, pricing, accounting, and marketing. Since computer The computer revolution is a revolution in the way we think and in the way we express what we think. ...

December 6, 2024 · 3 min · 589 words

Market bifurcation of journalism

Reader’s Willingness-to-pay For medium-price journalism, mass readers have two types of willingness-to-pay: Willingness-to-pay for leisure (magazine) Willingness-to-pay to stay informed (newspaper) Reselling Business The medium-price journalism was a reselling business: The top magazines and newspapers used to pay their best writers a dollar per word, to purchase the lucrative reselling power of making a profit of three dollars per word. The competition at medium-price was about quality, so well-written, long-form journalism were compensated well. Unprofitable Medium-price journalism has become unprofitable since 2020s: ...

October 24, 2024 · 🔄 October 23, 2024 · 2 min · 228 words

Analyst Working Class

Pay More to Read Less With the internet, the cost to consume texts has exceeded the cost to supply them. Just as fuel became too expensive for gas-guzzling vehicles in 2008, readers’ time has become too “expensive” for traditional long-form content today. This results in reader behavior changes: Switching to shorter formats (articles, summaries, abstracts, bite-sized content) Using audiobooks and podcasts while multitasking Seeking video or infographic alternatives, or in-person services like training and consulting. Since time has become so “expensive” for readers, ...

October 24, 2024 · 🔄 October 27, 2024 · 2 min · 259 words

Version of Mind

Notes To synthesize knowledge of a complicated subject that doesn’t fit into intuition, humans need a time-consuming read/write process to build symbols that abstract cognition. But symbols are fated to be forgotten. To accelerate rebuilds of cognition, we write notes, a cognition builds artifact, when being read will imperatively allocates attention. Lecture notes help a student prepare materials absorbed throughout the entire semester within just a final week. Code annotations help a developer quickly remember his choices of design made 6 months ago to reason behaviors of his software. Readability The readability of notes depends on the version of language it was written in. ...

October 22, 2024 · 🔄 October 23, 2024 · 2 min · 235 words

Learn English with Computer

无米之炊 作为同二十一世纪的中国一同成长起来的人,在“中国人学习英语”这条路上,我同太多太多人一样,因为缺乏教育,走了太多弯路;因为市场浮躁,听了太多谎言。而如今,当我有了独立思考的能力之后,眼里看到的,却是还是数不尽的弯路跟谎言。 中国人一出生就要背负许多悲哀,不知道怎么学习英语,算是其中一条。 在义务教育普及的时代,多数中国人都学过英语,然而几乎每个人自始至终,都未曾有机会和勇气,踏入真正的英文世界半步。从小到大,我们一直被要求写让中国人评价的英文作文,读中国人写的英文文章,听中国人读的听力材料,背中国人编排的英语词表。在高考的框架下,仿佛学习英语的终极目的,就是为了获得在中文世界里的体面,而非获得一把通往英文世界的钥匙,与随之而来的,更高的能动性。而从高考框架刚刚走过来的人,在本是理性生长跟培养能动性的年纪里,马上又被备考CET,TOFEL,GRE的大潮裹胁着,阅读大量令人生厌的文本,一遍遍啃完厚厚的词书,再次失去了享受自由学习语言的快乐的机会。 正像这世上既没有官方的TOFEL词汇表,也没有官方的GRE词汇表,学的人多起来后,市场上居然也有了词汇表;精通一门语言的过程,同样没人规定必须经受汲汲於功利的痛苦,可是大家,最终却还是都一致选择了痛苦。这在我看来,是因为视野之内,除了痛苦,没有出路。 中国人在我心中的形象,一直是隐忍而目光长远的,愿意坚强地蛰伏十年久,换得他日金榜名。然而这种目光长远,换来的却是欣然地迎难而上,进入一轮又一轮痛苦的循环,而不是努力寻找新的办法把自己从痛苦的循环中解放出来。长年累月隐忍的结果是,往往痛苦,反而带给我们崇高感,令我们体会灵魂的深沉。我们很容易在一条业已确定的道路上,沉湎于披荆斩棘,克服挫折的快感,却十分避讳冒险去发现另一条能化解困难的出路;好像深刻理解事物并创造出路,就是钻营取巧,属于懦夫一般。如此一来,学习英语的中国人,便少了从痛苦中寻找出路的痛感和动机;而没了动机,是很难等到出路的。 学语言就是学艺术 语言和钢琴一样,属于高雅的艺术,又同计算机类似,属于复杂的工具。语言的复杂性,决定了语言学习的过程,像是一片深不见底的理论深海,而二十一世纪的人类还是在海边捡拾贝壳那个孩子。有关二语习得(second language acquisition)的理论,自上世纪以来层出不穷,但神经生物学底层理论的空缺,让这些理论的得出更多基于观察归纳,大多流于“假设”(Input Hypothesis, Interaction Hypothesis, Output Hypothesis, Noticing Hypothesis), “模型”(Monitor Model, Competition Model),而非可以复现的“原理”。虽然二语习得理论的根基不稳,但在我看来,想找到中国人学习英语的出路,远远还不到研究并广泛传播二语习得理论的阶段。中国人现在要做的是无米之炊,首先要解决的不是不会做菜,而是米饭不够。 所谓米饭不够,指的是每个中国人手中既没有足够的英文文本以供学习,又没有够好的工具去管理手上的英文文本和词汇。对于这一点,我感触颇深。“想要在可选文本和管理工具方面解放国人”,成为了我编写 Vocabulary Picker 和 Vocabulary Manager 的直接动机。 在我看来,中国人学习英语的普遍需求,已经被教育市场绑架的太深,其中又以学习英语的文本,特为尤甚。从某种程度上讲,中国人学习英语的文本,被整个英语培训生态,垄断的十分彻底。在我的观察里,中国人往往并没有选择英语文本的自主权,或者说,“中国人没有机会读自己想读的英文”。跟我同样成长在内陆省份的那批人,从小就活在《新概念英语》之类的经典文本的阴影里,从来没有权利决定自己要读什么层次的英文,读什么话题的英文,读谁说的英文。对大多数中国人来讲,能够接触到的英文文本是极为有限的。特别是在中文世界的深处,每一篇英文文章都像是一张粮票,代表着一段时间的未来内 可以学到的所有英语词汇和表达。而这一张张粮票,则常常是英语培训机构选编成的一件件商品。中国人只有购买商品,才有英文可读。而没有英文可读的中国人,一旦萌生出学英文的念头,便会像着了急的企业诉诸咨询机构一般,立即委身于有商业口碑的培训机构,把英文文本的选择权利,又再度移交给了培训机构。如此一般中国人每对培训机构的依赖多一寸,整个英语培训的商业生态,对中国人英语文本选择权的掌控就会多一尺,而中国人离培养起自主选择英文文本的意识和能力就会远一丈。 英文文本在我心中对于解放中国人的意义如此重要,是因为它在我看来对语言学习有一极大的利好,那就是为每一个新的语言现象,立即提供有意义的语境,而有意义的语境反过来,又仿佛可以替代讲求定义准确的词典条目,成为语言现象最生动的释义。通过英文文本学习英文,似乎有着纲举目张,提纲挈领的功效,而这又好像是为什么几乎所有的英语教材,都以一系列课文为核心进行编排。虽然在二语习得理论中,“有意义的输入和输出”是很多理论频繁提起的,然而有意义的语境之于学习新语言现象的作用,对于经常反复学习少量英文文本的中国人来说,却又应该是深有体会的,不至于搬出学者的话语为自己撑腰。 英文文本自带的语境固然有用,然而通过这类文本中的语境来学习语言现象,最困难的莫过于高效的管理这些词汇和语境。文本的出处不一,载体也多样,管理起来自然繁琐。以书为例,原版书固然是很好的文学语境,对于学习文学词汇肯定大有裨益,然而其中的语境跟词汇却星汉灿烂似地散落遍地;若想仔细的管理起来,非得花足时间,下足功夫不可。 而在管理英文文本中出现的词汇,以及其他语言现象的工具方面,我见到中国人使用最多的,还是纸和笔。想用纸笔对词汇进行管理,就得老老实实得摘抄下整个句子,甚至整个段落。这种违和感,就好比见到想吃瓜的人都必须得先种瓜一样;我们想做的是对语言现象及其语境进行管理,而不是摘抄句子。至于出现这种违和现象的原因,我是部分能理解的。因为中国人能接触到的大部分英文文本都以纸为载体。纸上的信息并非是数字化的,自然无法用程序进行管理,只能靠双手去实现包含录入在内的所有管理逻辑。而至于为什么中国人可选的英文文本大都印在纸上,我想大抵还是因为那些文本,无一例外都是看重著作权的商品。 在众多语言现象中,以英文词汇为最繁。在我看来,文本中的英文词汇,天生就是种十分整齐的数据结构,躺在一套又一套的正则表达式里。而程序三大基本控制结构中的循环结构,又好像天生是为批量处理这类整齐的数据结构而生。这意味着生词倘若以数字化的形式呈现,便十分适合交由程序进行批量的管理。而想管理起我们在阅读英文文本中遇到的生词语境,最基本地,只需要管理单词本身、单词所在的句子、句子所在的段落,以及指向原文的链接,至多再加上收录生词的时间。有了这些最基本的原始数据,程序便成了可以“一生二,二生三,三生万物”的现代魔法,让人专注于对语言现象灵活而多样的管理,从而彻底从字母级的摘抄工作中解放出来。 既要给中国人带来选择英文文本上自由,又要让文本以数字化的形式呈现。这两项诉求,让我本能的想到了趋向无穷的英文互联网,想到了人们在浏览器上进行阅读的场景,想到了小部分人使用软件 **Anki [3]**管理单词的情状。 工具 英文互联网对于学习英语的中国人是一个巨大的语言宝库,哪怕只是其中可以畅通浏览的冰山一角,都可以极大丰富中国人可选择的英文文本。浏览器本身提供的丰富API,则让摘取词汇及其语境成为可能。而Anki[4] 背靠庞大的插件生态,又提供了大量类现成的,类似于“匹配词义”,“科学复习”的,一批能灵活管理单词的强大工具。这三者在一起,让我看到一条拦腰断开的路,能把学习英语的中国人从“文本选择”和“语境管理”的困境中解放出来;而连起这条断开的解放路,只需要一人之力。 这条断开的通路在我看来少了两个关键的组成部分,一个是能从英文网页中摘取词汇和语境的浏览器插件,也就是后来的 Vocabulary Picker[5],另一个是在导入 Anki[6] 前,能进行初步编辑和管理,比如删除词汇,恢复时态的桌面应用,也就是后来的 Vocabulary Manager[7]。 在技术方面,由于两个开源软件都力求在有限的开发时间内惠及更多的英语学习者,因而在技术选型上都以平台兼容性为要。其中Vocabulary Picker 选择了受众最广,插件丰富的 chrome浏览器 作为运行平台,Vocabulary Manager 选择了跨平台 (Win, Mac, Linux ) 的 Electron 作为运行环境。而程序的界面语言则优先以英文开发,目的是为了令软件可以同时惠及中国以外的英语学习者。由于我起初对 JavaScript十分陌生,再加上 JavaScript 的工具生态十分复杂,整个开发过程比预期中长了许多,从学习 JavaScript, ES6 Syntax, 和 Chrome API 到设计并完成 Vocabulary Picker,耗时大概1周;从学习 React, TypeScript, 和 Electron 到陆陆续续设计完成并发行 Vocabulary Manager,耗时大概两周。 ...

August 17, 2019 · 🔄 October 23, 2024 · 1 min · 144 words