相关文章

Synonyms 中文近义词工具包 -- 支持文本对齐,推荐算法,相似度计算,语义偏移,关键字提取,概念提取,自动摘要,搜索引擎等

Synonyms 入门介绍 Chinese Synonyms for Natural Language Processing and Understanding. 最好的中文近义词工具包。 synonyms可以用于自然语言理解的很多任务:文本对齐,推荐算法,相似度计算,语义偏移,关键字提取&a…

solr配置同义词、专有词的注意点

基于solr 6.5.0 版本 1. Solr配置同义词报异常 报错信息 xxx: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException: Could not load conf for core xxx: Cant load schema /www/solrhome/xxx/conf /managed-schema: java.nio.charset.MalformedInp…

CADD数据库简介

欢迎关注"生信修炼手册"! 衡量一个变异位点的影响时,通常都是给定一个变异类型,比如synonymous SNV 等,来表明其影响。CADD独创了一种打分算法,来衡量变异位点的有害程度。 对于一组变异位点,CAD…

全基因组重测序数据分析

全基因组重测序数据分析 转自:http://www.biodiscover.com/news/research/95875.html 1. 简介(Introduction) 通过高通量测序识别发现de novo的somatic和germ line 突变,结构变异-SNV,包括重排突变(deletioin, duplication 以及…

Spark RDD案例:词频统计

一、提出任务 单词计数是学习分布式计算的入门程序,有很多种实现方式,例如MapReduce;使用Spark提供的RDD算子可以更加轻松地实现单词计数。 在IntelliJ IDEA中新建Maven管理的Spark项目,并在该项目中使用Scala语言编写Spark的WordCount程序,最后将项目打包提交到Spark集群…

《生物信息学:导论与方法》----变异的功能预测----听课笔记(十一)

第六章 变异的功能预测 6.1 问题概述 Where did your genetic variations come from? inherited from parentsde novo mutations(70~100个新发突变)somatic mutations(体细胞突变,如癌症) 有很多的先天的小儿疾病…

python 小说人物分析_用python分析小说人物关系(二)——实战篇

用到的工具jieba jieba分词,最好用的开源中文分词工具。他最主要的两个功能是分词和关键词的抽取。在这里我们需要用他的分词功能来提取文本中的人名。 gephi gephi是一个开源的复杂网络数据可视化软件,可用于探索数据分析、链路分析、社交网络分析、…

In silico saturation mutagenesis of cancer genes 解读

这是一篇关于《In silico saturation mutagenesis of cancer genes》论文的解读,肯定有不全的地方,仅仅作为参考,如想深入学习,请结合原文。 In silico saturation mutagenesis 是一种术语,表示用计算方法来评估基因或…

生信软件32 - 变异位点危害性评估预测工具合集

转换和颠换如发生在基因的蛋白编码区内,根据点突变对和蛋白质翻译产生的影响定性,可以把点突变分为同义突变和非同义突变二种。 1. 基本概念 1.1 同义突变(synonymous mutation) 碱基替换不引起氨基酸改变称为同义突变。 1.2 非同义突变(non-synonym…

snpeff注释最全,包括错误分析和理解,3.0版本

经过半个月的乱七八糟,更新最近能理解的东西 首先自行去官网Introduction - SnpEff & SnpSift (pcingola.github.io)下载一个压缩包,经常用得到,反正数据有问题卸载之后再次安装可以重新构建 这里我重新构建一下,也算是重新…

Nature | 打破认知!张建之团队揭示多数同义突变对生物有大害

遗传密码在上世纪六十年代被破解后,人们认识到在蛋白质编码区有四分之一至三分之一的DNA点突变是不会改变蛋白质序列的。这些点突变被称为同义突变,而改变蛋白质序列的点突变则被称为非同义突变。因为同义突变不改变蛋白质序列,所以大家普遍认…

如何安装Win10系统

如何安装Win10系统 1.首先下载win10镜像 2.准备一个8G大小的U盘,向其中烧写镜像 笔者使用的是UltraSO的试用版,因为只使用这个软件烧写一次镜像后卸载即可 3.在电脑启动BIOS模式时 把Security mode选择Disable 把UEFI/Legacy Boot选择Yes开启兼容模式 …

国外批量扫 FTP 的软件

2019独角兽企业重金招聘Python工程师标准>>> webshell 里面找到的 搞个名字 rdp 我还以为扫 3389 的呢。。。 附件已上传 。。 UEsDBAoAAAAAAJAorEIAAAAAAAAAAAAAAAAEABwAcmRwL1VUCQADYLKOUWGyjlF1eAsAAQQAAAAA BAAAAABQSwMECgAAAAAAjCisQlUL/KAFAAAABQAAAAkAHAB…

Windows 7 or 8 Master Boot Record (MBR)

访问原文 An Examination of the Windows™ 7 or 8 MBR ( Master Boot Record ) [Also embedded in vdsutil.dll, winsetup.dll and various other System files; see Introduction ] Web Presentation and Text are Copyright©2011 by Daniel B. Sedory NOT to be repr…

安装程序无法将Windows配置为在此计算机的硬件

安装win10,win8时会有时有这个提示:安装程序无法将Windows配置为在此计算机的硬件 原因有2: 1,基本驱动不全 (解决方式是离线安装驱动:dism++) 2,BSD保护机制(解决方式是绕过或http://www.udashi.com/n/20160303/2893.html) 来自:http://bbs.luobotou.org/thread-10858-1-…

cmd命令及其问题

20220726 paddleocr --image_dir D:\project_pycharm\PaddleOCR_test\input\cut\1.png --lang ch --use_gpu False --type structure --layout false --output D:\project_pycharm\PaddleOCR_test\outputTrue和False不加引号,且大写 #20211019 https://www.cnblog…

密码与hash获取

文章目录 密码与hash获取windows本地认证hash获取与破解Hash的破解 密码与hash获取 hash的概念和hash函数不过多介绍了 现在很多md5的使用是双重md5或者加盐(拼接md5),知道盐值是可以解的。 hash算法在信息安全方面的应用:文件校验、数字签名、口令加密…

Win11开发环境设置

1. 目的 Win11 可以使用 WSL2 里的 ubuntu,某种程度上相当于双系统: 相比于 ubuntu 系统 安装虚拟机windows/远程连接windows要更轻量WSL2 的磁盘和 Windows 是共享访问的,有时候C/C工程要跨平台编译,可以原地编译,…

注册表实现欢迎界面的修改

原文件视频地址 欢迎界面 欢迎屏幕上写字注册表路径:HKEY_LOCAL_MACHINE\SOFTWARE\MicrosoftWindows NT\CurrentVersion\Winlogon找到 LegalNoticeCaption 欢迎语句LegalNoticeText 你好 更改欢迎界面 1.图片格式为jpg.大小为250kb左右。2.在C:\Windows\System32\oo…

解决报错:The CUDA compiler identification is unknown

在使用CMAKE编译是找不到CUDA,可以添加参数解决,错误如下 The CUDA compiler identification is unknown CMake Error at /home/XXX_USER/anaconda3/lib/python3.10/site-packages/cmake/data/share/cmake-3.27/Modules/CMakeDetermineCUDACompiler.cm…