0%

Termux是一个在安卓设备上模拟Linux终端的APP。借助这个终端,可以运行许多Linux程序;更进一步的,我们还可以在其上安装发行版并配置桌面环境,进而运行一些PC端应用(在华为最新的几款平板上,这个功能叫做“PC应用引擎”)。下面是探索的步骤

阅读全文 »

2022年底,openai发布了chatGPT这一通用对话式大语言模型,之后的2023年,通用大语言模型进入井喷式发展阶段。在国外,openai(以及微软)、谷歌、meta、Anthropic AI 等公司先后发布自己的闭源或开源的大模型,而国内的互联网大厂也赶上了这一波浪潮,发布了许多面向国内市场的新产品。在这些公司中,最早出圈的百度文心一言,现在则有阿里通义千问、腾讯混元、字节豆包、讯飞星火等一系列大模型产品可供挑选。

这些产品大部分都可以通过浏览器免费访问它们的网页版。然而在一些场景中,使用浏览器可能并不现实(例如在一些低性能电脑上,或者在服务器命令行场景当中——在后一种场景下,我们能交互的只有命令行界面)。幸运的是,我们还可以通过API调用这些大模型。

在世界范围内,GPT-4、Claude-3等国外公司的产品已经远远走在了领域前列,然而受限于跨国访问的网络不稳定,在本文教程中我们更倾向于使用国内互联网公司的产品。我们将介绍如何基于python编程语言和通义千问的API打造一款命令行chatbot工具,并结合百度网页搜索以及beautifulsoup4库实现信息在线查询的功能。

阅读全文 »

一直很喜欢《别赋》中的几句诗:“或乃边郡未和,负羽从军。辽水无极,雁山参云。闺中风暖,陌上草薰”。北京作为首都,兼顾着北方军事重镇的职能,而北京西部和北部连绵不绝的群山,更是照应着“雁山参云”的辽阔雄浑。刚刚过去的五一假期,我开启了一趟特殊的北京天津特种兵之行。

阅读全文 »

本文简单介绍了可解释机器学习的研究背景,并结合python的sklearn接口简单探索了一些实现事后机器学习可解释性的方法。这些方法将对实际应用中的数学模型搭建和分析起到重要的作用。

阅读全文 »

寒假那段时间,实验室的一位师姐不知道从哪里弄来了一颗郁金香的球茎,种在了实验室的阳台上。按照郁金香的花期,这段时间它应该已经开出了花——可是并没有,那颗可怜的球茎只是一味的长叶子,长得长长的就跟蒜苗一样高,甚至连个花苞都没打,一点开花的迹象都没有。

在排除了光照(实验室光线很充足)、营养(应该不缺吧?)、水分(可充足了)等影响因素之后,这颗球茎不开花的最大可能原因就是温度了。查询了一些种植经验帖,发现很多人提到郁金香需要冷藏一个星期左右的时间再来种植,因为郁金香等植物确实需要春化作用才能开花。师姐承认她没有做这一步处理,也许正是这个原因导致郁金香没有开花。

于是利用空闲时间,查了一下植物的春化作用的相关知识点。

阅读全文 »

在RNA-seq数据的分析流程中,基因集富集分析(Gene Set Enrichment Analysis,GSEA)是一种很常用的下游分析方法。这一方法在2005年由MIT博德研究所开发,用于确定先验定义的基因集(如特定信号通路的编码基因、疾病性状的关联基因等)是否在基因表达差异分析的结果上出现统计学显著性。

因为课题的原因,最近再一次复习了一下GSEA方法。目前有许多工具都能进行GSEA分析,例如博德研究所官方提供了一个基于Java编程语言开发的GSEA计算工具 ,南方医科大学的余光创教授开发的R语言工具包ClusterProfiler也提供了GSEA分析的功能。本文将简单介绍一下GSEA的原理,并举例说明如何使用博德研究所官方的工具包做GSEA分析。

阅读全文 »

前些天,在电脑上安装R包时碰见了一个问题:

1
2
3
4
5
6
> install.packages("FastEPRR_2.0.zip")
inferring 'repos = NULL' from 'pkgs'
package 'FastEPRR' successfully unpacked and MD5 sums checked
> library(FastEPRR)
Error: package or namespace load failed for 'FastEPRR':
package 'FastEPRR' was installed before R 4.0.0: please re-install it

根据报错提示,应该是我们用的R包版本比较老所导致的不兼容问题。这个R包并非官方CRAN上的包,而是实验室自己开发并封装的计算工具包,因此只有离线安装这一种安装方法,并且这个包的版本只与R 3.x.x版本兼容,低于系统里装的R 4.3.1版本。

下面是一些探索。

阅读全文 »

上一节中,我们介绍了几种跨设备的文件传输方案,其中提到了坚果云webDAV服务。鉴于坚果云的存储空间有限,为了获得更好的使用体验,本篇我们将要介绍在Linux云服务器上自建webDAV网盘服务的方法。

阅读全文 »

刚放寒假那几天,有位朋友问了我一个问题: 有什么不限制文件格式的、基于网络的文件互传/同步工具或云储存,以便于代码/文档/图片等在不同设备之间的共享? 这个问题之前没有仔细研究过,模模糊糊也只是知道有一些技术可以实现这样的文件共享,于是想着专门学习一下。然而,寒假期间除了休息和给长辈帮忙,就没怎么给学习留下时间。这不,趁着寒假快要结束,刚好抽出点时间来探索一下这个问题。

阅读全文 »

“简单来说,normal模式中按下字母q进入录制模式,此时的操作会被记录。再次按下q录制完成。要执行已录制好的宏,只需要键入n@a即可,其中n是执行次数,a是宏名称”

阅读全文 »

dataframe是统计学研究中经常使用的一种数据格式,最早在R语言上实现。python作为后起之秀,通过pandas这一模块也实现了对dataframe的支持。那么,这两种不同编程语言的dataframe又有什么区别呢?二者之间能否实现数据互通呢?本文将回答这些问题。

阅读全文 »

本周对博客中的一些历史文章缺失的图片进行了修补,此外对博客页面的外观进行了一点点微调——现在的卡片比之前更圆润了。

这一周更新了三篇文章:《obsidian探索小记(三)——与flomo笔记的联动》《常见服务器作业管理系统》《使用Python的SymPy库求解不定积分》。前两篇文章来自和同学交流中收集到的一些话题,而最后一篇文章来源于科研生活,某天师姐在推导公式时遇到的一个问题。

阅读全文 »

这个问题是某天我们年级的一位同学提出的,感觉很有意思,就在这里记录一下。

本题算是数学方法应用在生活中的一个小例子了。

阅读全文 »