学习 – xiaoanda

AI：助力与危机——ChatGPT与星火使用体验

导言：ChatGPT已经诞生有半年左右了。人工智能正式进入了人们的生活，引起人们的热议。我也把我的使用体验和一些思考记录下来。

一、使用体验

使用ChatGPT，对工作、学习和生活，非常有帮助。

ChatGPT迅速对我提问的问题提供汇总回答。这是和传统的搜索引擎非常不一样的一个点。

传统搜索引擎基于单个网页的信息汇总。也就是说，单个网页的信息汇总成什么样传统搜索引擎就展示成什么样。搜索引擎提供多个网页的列表，但并不对这多个网页的内容进行汇总整理。用户必须通过简单浏览几个网页或者是其中一个网页（幸运的话）来汇总整理出自己需要的信息。

ChatGTP整合很多数据库，或者包括书籍，网页，图书馆等各种信息知识，汇总回答使用者的问题，高效地替用户完成了费时费脑的信息汇总工作。

二、助力工作、学习和生活

AI对我这个生信初学者来说，提供非常方便的帮助。

在系统学习上，我还相信，通过阅读书籍或者学习网络课程可以得到系统的知识。可以求助AI，从而迅速查询到书籍列表或者网络教材。

在面对具体问题时，我们习惯使用搜索引擎来寻找，网络上是否已经有人提出类似的问题，并且有人提供比较好的解决方法。 AI则直接提供了问题的解决方法。对生信来说，可以寻求AI在代码上的帮助，然后拷贝AI提供的代码直接试运行。如发现出现问题就可以反过来问AI，为什么会出现问题，AI可以做出相应的调整代码。当然AI有出错或者是提供错误的代码，不能进一步解决的问题。但从另一方面来说，网络上往往不存在直接可以试运行的代码。所以AI在这方面体现出极强的竞争优势。

在生活上我尝试问AI是否可以提供旅游景点建议。AI也能给出非常具体的景点介绍。这对迅速了解一个旅游地点或城市的旅游资源，有很好的帮助作用。

三、感受到危机

（一）对AI的回答要保持警惕

我在阅读赵卓云的《万古江河》一书时，遇到“晁错奏议”这个词。于是我问了ChatGPT。

以下为chatGPT的解释，未见于其他网络材料:《晁错奏议》是《史记》中的一篇奏议，由汉代大臣晁错上书，上请废黜权臣吕后，恢复汉武帝政治，整顿社会秩序，以振兴汉朝。该奏议内容丰富，主要包括以下几个方面：

一、对吕后势力的批判：晁错认为，吕后专权，滥用别人之力，扰乱朝纲，致使官僚腐败，生灵涂炭，风俗败坏。

二、对汉武帝政策的肯定：晁错赞扬汉武帝的治国之道，认为其政策无私，法治得当，国家稳定，民众安居乐业。

三、对朝政改革的建议：晁错呼吁废黜吕后，恢复汉武帝政治，实行严格的律法，整顿官场，减轻百姓负担，培养人才，以振兴汉朝。

《晁错奏议》成为古代中国重要的政治文献之一，不仅反映了中国古代政治的腐败问题，也为后世政治改革提供了很好的参考。

是不是看着非常的靠谱？但是我借用搜索引擎来搜索这个词的时候，得到非常少的搜索条目。而且这些搜索条目里面并没有类似的介绍。

然后我进一步问ChatGPT，这个词出自哪里？他说来自《史记》的某一章。但我查阅史记的这一章节的时候，并没有看到类似的内容。

如果我没有接着去搜索，并去追问，我非常可能就真把这一个“知识”记住我的大脑。

这让我大吃一惊。在我们使用搜索引擎时，我们有更多的条目可以比较判断，或者根据条目的来源权威性来判断可信的程度。但我们现在使用的ChatGTP，这种比较选择就非常有限了。

我还有一次向ChatGTP提问，说中国是否出现过高考满分的考生。ChatGTP，列出了4个人。我一一搜索都没有得到这4个人考满分的信息。我在搜索引擎里面知道河南省何碧玉考了标准分满分。我向ChatGTP和讯飞都提到何碧玉后，他们都迅速承认，何碧玉确实考了高考满分。当我进一步追问信源时，ChatGTP说，“大语言模型没有确切的信息来源。大语言模型的回答来源于推理和猜测。信息可能不可靠，请进一步查找确认。”而讯飞非常坚决的说，这是真实发生的事情。

就这一点来说，我觉得美国的ChatGPT在人工智能方面表现的更为人文主义，更为谦逊。而我国的讯飞，真是一个技术宅男。对人工智能的局限性和危险认识不足。

（二）国家、“族群”在人工智能上的竞争

有一段时间因为网络的原因没法使用chatGPT，被迫使用讯飞来解决生信学习中的代码问题，是发现得到代码不如chatGTP理想。

在网络被限制的情况下，我们在人工智能方面也被限制了。对于整个国家来说，相当于我们的智力或人工智能智力受到了限制。在当前中美竞争激烈，要不断的分割的情况下，让我感觉到更强的危机感。

把视野扩展到更理性更直观的角度来看。chatGTP等大数据模型，除了算法外，AI公司“饲喂”了大量的数库库资料。这些训练用的数据库资料本身是人为选择的。有语言、族群的差异。其中有事实（fact）的部分，也有观点（opinion）的部分。这些混杂内容很可能在AI中输出而影响使用者的价值观。

弱势的国家、文化很可能会被进一步的弱化。

(三）法律、知识产权……

我们不清楚大数据模型使用的是哪些数据进行预训练。这些预训练的数据是否涉及知识产权？

如果大数据模型产出的内容，涉及个人隐私、未成年人保护，甚至影响他人名誉，法律责任如何界定？

如何参与ChatGPT发展？

每一次技术进步，对一部分人来说，是灾难；对一部分人而言，是机遇。对新技术的钝感、无视、鄙视，可能带来灾难。而积极了解、深入学习、开放大脑，也许带来机遇。

这一轮ChatGPT热潮，给账户倒卖、API接口、知识整合后再兜售的急先锋们带来了一笔快钱。

对不会编程，或不熟悉计算机技术的人而言，除了利用ChatGPT提高生产力之外，还有什么可以参与到ChatGPT发展的事情可以做呢？

对此，我问了ChatGPT:

Me: How can one who know little coding take part in ChatGPT?

ChatGPT:

As an AI language model, I suggest you can take part in ChatGPT in several ways, even if you know little coding. Here are some ideas:

Participate in discussions: You can read and participate in discussions on various topics that interest you. You can share your views, ask questions, and engage in healthy conversations with other users.
Share your expertise: If you have expertise in a specific field, you can help other users by sharing your knowledge. You can provide valuable insights, tips, and advice to help other users solve their problems.
Collaborate with others: You can collaborate with other users on various projects, such as writing articles or creating videos. You don’t need to know coding to contribute to such projects.
Ask for help: If you need help with something, you can ask other users. You can search for answers or post questions on the relevant topics. Other users may help you with their expertise.
Use non-coding tools: There are many tools and platforms that you can use to contribute to ChatGPT. For example, you can use graphic design tools to create images or videos, or you can use content creation platforms to write articles or blog posts without knowing how to code.

Overall, there are many ways you can participate in ChatGPT, even if you know little coding. You can leverage your skills, expertise, and interests to contribute in various ways.

这回答得，有些参考价值哈。

哺乳期妈妈，多亲亲您的宝宝

新生儿的IgG抗体的产生要在出生几个月后才开始。幸运的是，来自母亲血液的IgG抗体可以穿过胎盘进入胎儿的血液，因此新生儿有这种来自母亲的“被动免疫力”来帮助他度过难关。新生儿还可以获得另一种被动免疫力：来自母乳的IgA抗体。在泌乳期间，血浆B细胞会迁移到母亲的乳房并产生分泌到乳汁中的IgA抗体。这很好，因为许多婴儿遇到的病原体会通过口腔或鼻子进入他们的肠道，并引起腹泻。通过喝富含IgA抗体的母乳，宝宝的消化道中充满了可以拦截这些病原体的抗体。

然而，母亲在她的一生中接触了许多不同的病原体，她制造的大多数抗体对婴儿没有用处。例如，母亲可能有识别引起单核细胞增多症的EB病毒的抗体，但她的孩子可能要到十几岁才会接触到这种病毒。那么，如果母亲能够以某种方式提供识别她的宝宝正在遭遇的特定病原体的抗体，并且不提供对宝宝没有用处的抗体，那不是很好吗？

事实上，当母亲亲吻她的宝宝时，她“取样”了那些出现在宝宝脸上（即将被摄入）上的病原体。这些样本被母亲次级淋巴器官（例如扁桃体）吸收，并重新激活针对这些病原体特异性记忆B细胞。然后这些B细胞就会产生IgA抗体并通过母乳为宝宝提供免疫力。

开玩效率工具——“幕布”“Typora”

由于学习记录的需要，开始玩一些效率工具。简单记录一下。

幕布

非常合适做阅读笔记。

最近读了两篇TCGA miRNA-seq的文献，想把文献的思路、两篇文献的差异、对自己工作的启发记录下来。发现用幕布来记录，可以方便得到有层次的思维导图。这样，基本就实现了与用笔和纸写写画画的效果，而且不乱，还可以扩展。再了解一下幕布的进阶功能——可以插入公式、小图标（可以让笔记更有层次，更易于分类）。

随手把明天开始上的单细胞分析课程整理了一篇。总算积极主动地为上课做一次准备。

现在正在学的卫生统计学，大概也可以把笔记电子化一下。

读文献，整理文献思路也很好用：

目前为止，我在用免费的幕布基础版，还没有升级的要求。

Typora

记录代码的好工具。我主要用它来记录linux代码和操作流程。R语言，则直接在R studio上记录。python，用Jupyter notebook记录方便。

Typora，很便宜。我直接买了个正版的。

Mendeley

文献管理软件，elsevier出品。

用mendeley，不用endnote，是因为endnote太贵了。用免费的mendeley，可以轻松管理文献，可以在word中标注文献出处，高效完成论文中的文献管理。

mendeley有一个非常赞的功能——给文献打多个标签。这样，可以方便地根据标签集中阅读某些内容的文献，如miRNA，Parkinson’s。

运动减肥原理及注意事项

昨天把去年参加训练营的减重原理又重新复习了一下，总结记录一下：
1、减肥总的原理要靠热量差，摄入小于消耗

2、摄入不能随意减少，要达到基础代谢量。基础代谢量是没有运动时候身体自身消耗的能量。如果长期减少摄入低于基础代谢量，基础代谢的数值也会降低

3、基础代谢量的基本计算公式：
女：65.5+9.6×体重+1.7×身高-4.7×年龄
男：66+13.7×体重+5×身高-6.8×年龄
其中，身高单位是厘米，体重单位是斤。按这个公式推算的基础代谢和咖喱给的差不多

4、减重过程中三分锻炼，七分吃。要想瘦，要调整好饮食，摄入卡路里的比例为30%的蛋白质，30%的脂肪，40%的碳水化合物。可以在APP后台自定义设置，摄入的食物都要沉重计量，经过一段时间的观察，找到合适的组合。为了保证效果，减少意外，如果能采用备餐的方式最好，在制作的时候计算好热量和三大元素比例，准备若干份。直接吃就可以了。

5、运动的过程无氧必须要有，因为无氧会撕裂肌肉，增加肌肉的合成，从而增加基础代谢

6、数值不是最重要的，纬度才是

在减重初期，合理的吃才是关键。要探索合适自己的备餐

生物学科研道路的生与死

今天和一位生物学博士聊生物学科研的事。这位生物学博士从医科大毕业，应该说对生物学科研有相当的了解。

因为工作的原因接触的科研人员比较多，经常遇到这样的问题：我的实验结果和文献上的不一致。为什么我们做不出来，别人能做出来？

这位博士说，经常重复不出来别人的结果，甚至结果和别人的结果相反。解决的办法就是重复很多遍，最后选择与别人结果一致的结果来写论文。

我一直有一个疑问：如果第一篇论文就是错的呢？所有的后来者一起跟着错？

如果都是这样做科研，真的就做“死”了。

要在生物学科研的道路上，“活”下来。只有不断地创新，走来别的人前面，不要跟随模仿。有自己的路径，一直走出去，不断地有创新性的研究成果。

遇到与别人结果不一致的情况，要么找到自身问题的原因，要么质疑、反驳别人的结果。但这样的情况，只能是在自己的道路上，搂草打兔子的事。它不是在科研道路上“活”下来的办法。

学习计划与激励机制

对初学者而言可以做以下三种假设：1，几乎所有的初学者都不喜欢学习。2，学习是一门苦差。3，所有的成绩都源于刻苦的学习。

正确的认识并承认这三种假设是很难的。我们通常给自己鼓劲或给别人鼓劲说学习不难。你会喜欢学习的。

事实上我们更愿意看一部小说、一段视频，吃一顿大餐……初学任何一种新的技能知识都是困难的事情。必须付出辛苦的努力，才有可能取得成绩。

在这艰难的时间里，应该制定一个一步一步的学习计划，有阶段性的学习目标。当达到学习目标的时候，应该给学习者一定的奖励，帮助初学者度过艰难的入门时间。

生信学习笔记

学习生信的步骤：

1. Start with a foundation in Python/R and bash

In Python/R: Just get to the point where you can read in data and run a statistical test.

In Bash: Be able to navigate around directories, open files, and run a program (like sort, uniq, or wc) and output the result to a file. Check out my intro video on bash for quick tutorial on getting started on the command-line.

2. Do a small project

3. Occasionally do tool safaris

4. Build tools to fill gaps as they come up in your research

为什么要学linux？

初学python，在windows下完成一些简单的编程，对python有了一些基础的了解。也遇到几个明显而且急迫需要解决的困难:

读懂别人写的代码。有相当多的代码，我仍然无法理解，也就无法学习或借用。
进入社区，参与代码讨论。不会把自己的代码打包，发布到社区上。不了解有哪些社区合适我，也不了解它们的玩法。
运算速度慢，却不会分析如何提高运算速度。
不会调用外部程序。

进一步学习Martin Jones的第三部python书，开始更多地在linux上举例。于是，我就跳进了另一个坑——linux。这个坑和刚学python时的体验很相似:大量的时间耗在软件安装和配置上。

但随着学习的展开，模糊地认识到，python可以方便地调用命令行（linux常用命令行），而很难直接操作windows的图形界面。这为python调用其他程序提供了便利。

用python做生信分析

DNA互补序列

代码1：

dna_sequence_orange = "ACTGATCGATTACGTATAGTAGAATTCTATCATACATATATATCGATGCGTTCAT" complement1 = dna_sequence_orange.replace("A","t") complement2 = complement1.replace("T","a") complement3 = complement2.replace("G","c") complement4 = complement3.replace("C","g") dna_sequence = complement4.upper() print(dna_sequence_orange) print(dna_sequence)

代码2：
dna_sequence_orange = "ACTGATCGATTACGTATAGTAGAATTCTATCATACATATATATCGATGCGTTCAT" dna_sequence = list(dna_sequence_orange) i = 0 lenth = len(dna_sequence) A = "A" T = "T" C = "C" G = "G" for i in range(lenth): if dna_sequence[i] == A: dna_sequence[i] = "T" elif dna_sequence[i] == T: dna_sequence[i] = "A" elif dna_sequence[i] == G: dna_sequence[i] = "C" elif dna_sequence[i] == C: dna_sequence[i] = "G" else: print("The is something wrong in the sequence") i = i + 1 print(dna_sequence_orange,''.join(dna_sequence),sep='\n')

继续阅读用python做生信分析