生物信息技能的真空地带
我在朋友圈感受到一股强烈的割裂气息:"我什么都不想学,但是需要快速发文章",这让我觉得今年是中文世界里,生物信息数据挖掘的转折之年。
这种气息在从业的6年中从来没有这么强烈。
口罩的三年,成千上万个研究生的无奈自救,应该加速了生物信息在国内的普及,这也加深了人们对生物信息技术的误解。
典型的场景就是
“你这个结果太单薄了,加点生信,至少看起来饱满一点”,
“我需要A调控B的结果,你用生信来串联一下”,
“从这个转录组里面帮我找到最重要的分子,不行?生信不就是干这个的么!”
“你这都是生信的结果,你自己的数据呢?”
一方面,闻香而来的后继者发现纯生物信息发文章没有那么容易,文章审稿的碰到的审稿人都是已经上岸的前辈,摇身一变就是正义的化身,愚蠢的生信休想在我这里占到半点好处。
另一方面,猛禽课题组发文基本上都依赖大型队列的生物信息加持,资源充沛的可以一篇接一篇,甚至现在花个1000w发篇大子刊文章都觉得是赚的。
这种观念上的天差地别以及科研上的高强壁垒,自然而然的在食物链中间形成了一个人迹罕至的肥沃地带。
他们就是拥有完善生物信息技能,但是还没能够自己产生数据成熟生信工作者。
当前他们拥有一个得天独厚的领域,那就是单细胞数据挖掘。
因此我们说,单细胞分析,属于科研探索类分析,他需要很全面的技能,他不像TCGA那样,有个固定的模版,因为单细胞数据千人千面。
假如你也想做个技能全面,能独当一面的单细胞数据分析工作者,可以看一下果子团队开发的这个诚意满满的单细胞SC00课程,他用18个月的时间迭代了三个版本,课程架构恢弘,技能硬核实用。
本次持续6个月,课程第一次授课时间是5月25日-26日。
哪些人群适合?
1.想要系统学习Linux,R语言,Python在单细胞领域应用但是不想东拼西凑浪费时间的朋友
2.自己手上有单细胞数据,自己能跟着流程常规分析,但不能合理解释结果无法拓展分析维度的朋友
3.在未来有读博计划或者博士后申请计划,需要积累配套单细胞技能的朋友
4.出了或者即将走出实验室,甚至干脆没有实验室,想要获取非实验室依赖性傍身技能的科研工作者或者医务工作者
单细胞课程架构
总体框架就是R+Python+Linux三者齐备,具体到细节十分恢弘。现简单介绍如下:
单细胞R语言2天(需要R语言基础,如果没有会提供基础课程补充)
单细胞分析的基石是R语言,这部分内容将会带领单细胞零基础的学员进入单细胞的世界。
我们将学习掌握Seurat对象的各种数据提取和存放,把我们在GZ00学习到的Bulk RNAseq分析经验全部迁移过来。
这部分会涉及单组数据分析流程,以及多组数据整合流程。这是基石课程。
Python从零开始教学2天
不学习Python,单细胞技能只有一半。Python在单细胞分析中属于砌墙的砖头,后来居上。Python中积淀已久的机器学习,深度学习,碰上单细胞提供的大样本,光芒万丈,迅速抢了R语言的风头,未来可能是得Python者得天下。基于Python的单细胞分析方案层出不穷,我们会从零开始教大家学会Python,并且因为大家都有R语言基础,Python的学习周期会大大缩短。
经历过R语言和Python课程的铺垫,我们现在就是两条腿走路,可以十分稳健的开启专题课程的学习啦。这个课程中,我们也会给大家展示如何用chatGPT来辅助细胞分群注释,助你在Python的世界,越陷越深。
单细胞GRN课程1天(目前提供三个迭代的版本,从无到有感受技能梳理的过程)
基因调控网络(gene regulatory network,简称GRN)分析已经司空见惯,不足为奇。但是扰动数据中的GRN分析流程,十分缺乏,我们在课程中开发了一套针对扰动数据的GRN分析pipeline,可以从既往数据中挖掘出新的内容。Meta Cell技术和Sigularity技术的引入,让SCENIC分析的时间和内存大大缩减。基于R语言开发的SCENIC post 流程,使得模块化,搭积木式的组合分析成为可能。你不再需在固定的分析阶段产生固定不变的图,而是要根据自己的需求随机应变。更有趣的是,我们会提供这个GRN课程的三个迭代版本,让你从无到有感受技能梳理的过程。
单细胞Reference Mapping 1天(人人可用)
假如单细胞未来有个超级大图谱,就好像是人类有了基因组,那么任何细胞都可以在这个图谱中找到正确的位置。
但是此刻这个图谱还在拼接中,也就意味着我们都在路上,未来的目标和现实就是,人人应该有个感兴趣细胞的图谱。
这部分我们将会带领大家掌握常见的图谱构建以及映射技术,并且还会展示我们团队开发的Reference Mapping R包。
单细胞轨迹和速率课程1 天
轨迹,拟时间的出现,就像是给原始数据增加了一个维度,在这个维度下,你更容易窥探到数据隐藏的奥秘。这部分内容中,将会出现微分,极值等概念。
数据和生物的交相辉映,一定会让你感受到计算生物学的精彩。本次课程中我们会把GRN和轨迹分析联合起来,让你在时间维度上去分析GRN。
单细胞以及Bulk RNAseq的上游分析
专题课程过后,面对一份新的数据,你已经游刃有余了。这时候我们要教会你如何处理单细胞的上游,包含10x,BD,华大,smartseq等单细胞数据。
课程中还引入了STARsolo流程,可以极大的缩减单细胞的分析时间和内存占用,告别让人崩溃的BD流程。
因为这部分要在服务器操作,并且要使用Linux和服务器交互。我们在此赠送了两个专题课程,
第一,Linux和转录组上游分析,让你以专业人士的方式理解传统RNAseq的上游分析,以及单细胞上游分析
第二,考虑到单细胞学员,最终都会是Power用户,都有可能刺激课题组购买服务器,我们也呈现了专门的单细胞管理课程,把团队积累数年的服务器管理流程和盘托出。
到此,R,Python,Linux 已经三者齐备,你没有短板了。
单细胞衍生技能,细胞通讯,利用单细胞进行Bulk数据反卷积
单细胞的数据大量积累,基于单细胞的衍生技术应运而生,这部分技能作为课程的补充,可以让你的分析丰富起来。比如,我们可以利用单细胞的数据去反卷积Bulk RNAseq的数据,简单的使用场景是,所有的TCGA癌种都可以在对应的单细胞数据下重新分析一次免疫浸润,这样TCGA的所有临床数据就重新用起来了。
GZ专题课程1,4,5,6,8
我们还额外赠送了5个GZ课程用于专题训练,这里都是一些甜点,让你不要忘记在传统RNAseq那里积累的技能。
赠送的5个专题课程分别是微店中的GZ01,GZ04,GZ05,GZ06,GZ08
其中GZ01课程,实际上就是课后作业的第一题,他使用大课中的教授的数据调整思维,搞定了TCGA,GTEx,CCLE三个数据库数据的调整,最终复现了Nature的9张图,特别具有代表性。
我们把GZ01课程和GZ07批量课程联合起来,创造了一个在线分析工具GTBAdb
http://guotosky.vip:13838/GTBA/
我们把GZ01数据调整课程和GZ06 基因集富集分析教程联合起来,创造了另外一个在线分析工具GPSAdb
http://guotosky.vip:13838/GPSA/
这些技能,硬核实用,百变高效。GZ04是免疫浸润专题,GZ05是WGCNA专题,这部分也会在单细胞分析中用得上。
其中GZ04涉及到的基因集打分策略,将会在单细胞领域大放异彩。
单细胞高燃瞬间
这里我讲两个瞬间。
第一,扰动数据都可以重新分析一轮
在批次矫正前提下,通过GRN得到的Regulon对数据重新降维,可以发觉深藏的数据差异(第二列)。
如果把找到的转录因子删除,能看到组间差别缩小,说明这些转录因子真实可靠,我们起了个名字叫做In silico Rescue(虚拟回复)
Senic分析过后得到的Regulon,通常可以分为两类,
第一,细胞间特异,表现为在细胞间有很大差异,组间没有差别
第二,组间特异,活性在两个处理组间有很大差异,没有细胞特异性。
让人开心的是,在课程中,我们使用方差分解的方法,提取到了同时符合细胞特异和组别特异的Regulon。
他们能更好的解释扰动条件下,细胞特异的应答方式。
比如,我们STAT1(+)这个Regulon,他在Monocyte特异表达,并且在刺激后显著激活。
而这样Regulon我们可以提取出一群。
GRN专题课程的出现,让我们可以用新的方式探索老的数据,从而得到不一样的信息。
第二,单细胞轨迹和速率课程中各种手工代码实现的算法
单细胞数据得到拟时间后,数据就多了一个时间维度,根据时序RNAseq的分析方案,我们手工实现了不同表达模式的基因聚类。
并且因为多了时间线,我们甚至可以使用一阶微分找到分化潜能变化最大的位置,使用二阶微分确定极值点。
这样在时间和斜率的视角下,我们可以找到那些转录因子,哪些通路,在分化潜能变化前已经暗度陈仓,哪些通路在推波助澜后功成身退。
轨迹课程给你戴上了一副眼镜,世界没有变,数据没有变,但是你看得更清楚了。
此刻,数学和生物交相呼应,正是计算生物学的魅力所在。在这一期中,我们会在这个时间线上融入GRN分析,让转录因子的确定更加精细!
这还没有完,轨迹和速率课程,还涉及到以下硬核内容。
单细胞学员反馈
每次专题课程上完,群里就几乎没办法睡觉了。
此处提取一些评论供大家加油打气使用。
这是GRN专题课程过后的评价
这是轨迹和速率专题课程过后的心得
因为这帮人太能夸人了,因此群也被称为“夸夸群”,
因为夸人太到位,从而导致讲师一再加课。
因此还诞生了果子团队加课的一键三连。
"赞美,起哄,土特产"
对单细胞学员的期待
希望你能够把课程完整学完,哪怕只有一遍,你以后看别人分析,心里就不会那么惊讶了。
常见问题回答
我R语言零基础,能参加这次课程么?
听我说,R语言零基础,你要做点补齐的课程。
如果你经过同学老师介绍,一定要参加我们的单细胞课程,建议你先学习果子团队的GZ00课程(下一期是10月份,你可以报名后先学习录制的课程)。
科研人的生物信息灵魂课程GZ00
不方便参加GZ00课程的,可以尝试一下我们上传在B站的免费R语言课程。
开心一下!果子在B站上传了一份54节课的R语言数据挖掘基石教程
但是无论如何,你不能R语言零基础就过来,我们课程中还要从零开始学习Python,同时学习两门语言的压力十分大。
我们的课程丰富,但是不喜欢你上来就被打击。
我适合学习单细胞课程么?
这个问题,不应该这么问,单细胞应该是你当前的分析需求,或者未来进入新课题组的技能储备。
此刻,你应该描述一下你的背景,单独这么问,没有好答案。
假如你已经是GZ00学员了,老板要求学习单细胞或者自己对单细胞感兴趣,本次的单细胞SC00课程是首选。
假如你没有任何编程基础,就是觉得单细胞神秘,可能未来有用,不要参加这个课程,先去学习R语言或者先读文献。
不能变现的课程,没有生命力。你未来要么是做项目,要么是发文章,技能需要一个释放的口子,形成正向循环。
你们答疑是怎么进行的?
我们长期答疑,但是要区分是技术答疑还是学术答疑。
对于课程内的技术,我们可以提供坚如磐石的答疑,你只要花时间,肯定能学会。
但是,单细胞的问题,没有哪个人敢打包票,单细胞的特别之处在于他当前解决的就是异质性的问题,单细胞数据有很强的生物背景。
你这个领域的很多基本问题,我们是没有办法答疑的,希望能谅解。
你们课程的特点是什么?
实用,高效,前沿,能解决问题。
想要给有R语言基础的人,尤其是GZ00的学员上课,是挺有难度的。因为常规的流程,他们都能自己跑通。所以一般的课程,根本入不了他们的眼。
我们课程在设计的时候,融入了大量的实战经验,和最新的科研思维。我们甚至告诉大家,我们会用课程中的方法发表一篇10+的文章。
在课程中,出现了很多原创性的流程和方法,比如GRN后的Regulon降维,单细胞中的方差分解,高等代数微分在轨迹上的使用。
现在报名后,我需要做些什么?
我会把你拉到专门的答疑群。
接下来你有两个不相冲突的选择:
课程是否可以开发票?
可以开发票,内容是线上会议或者线上培训,如果是线上会议可以搭配红头文件的邀请函。当前发票不能开试剂,请知悉。
单细胞课程报名信息
我们列举一下当前课程的内容:
单细胞R语言2天(需要R语言基础)
Python从零教学2天
单细胞GRN课程1天
单细胞Reference Mapping 1天
单细胞轨迹和速率课程1 天
空间转录组课程1 天
赠送课程,单细胞上游分析STARsolo课程
赠送课程,Linux服务器管理课程
赠送课程,Linux和转录组上游分析课程
赠送课程,GZ专题课程1,4,5,6,8(泛组织,免疫浸润,WGCNA,基因集富集)
答疑群长期答疑(文字,语音,直播,远程协助)
稳妥诚信的课程更新机制(每个学员最终会获取至少2个版本的课程,上一个版本以及所在班级直播版本)
彩蛋课程(单细胞去卷积,InferCNV,细胞间通讯等)
总共涉及7天+直播,10天+的学习量。
(注意,以上"天"的意思是早上9点到晚上,中间会给午饭和晚餐时间,但是课程不包餐饭)
最终的课程费用是:
3200RMB/人,童叟无欺。
课程在腾讯会议线上开展,
首次直播时间在2024年5月25到5月26日,后续直播会在答疑群内通知。
钟意的朋友扫码在微店直接下单(代号SC00 ),下单后联系果子,可以提前学习起来。