当前位置:
文档之家› BIBEXCEL简单使用教程
BIBEXCEL简单使用教程
文件 编辑doc文件 编辑out文件 增加数据类 分析 杂项 图谱 帮助
File菜单-文件
复制文件 重命名 删除文件 新建目录 删除目录 某个文件合并到另一文件 将所有被选择的文件合并到另一文件 将列表保存到文件 退出
Edit doc file菜单-编辑doc文件
生成新记录 删除字段 识别重复记录 删除重复记录 删除指定文字 重命名字段标签 将换行符替换成回车符 从doc文件中选择文档号 从out文件中选择文档号
Add data classify菜单给out文件添加分类一精确匹配
给out文件添加分类一子字符串匹配 给out文件添加分类一子字符串匹配 给词频对文件添加分类 利用Levenshtein距离添加分类 为词频—文档号-文档号添加标签 为文档号—文档号对添加标签 二进制查找 合并两个文件 比较相似字符串 将简写形式的期刊名与其全名进行匹配 将简写形式的单词与其全名进行匹配 在字符串中查找某个代码词 在字符串中查找某个字符串 在列表中查找某个单词
标签栏
• 后面产生具体某一字段的out文件时会用到这个部分,也可以在转换 文件格式时产生的doc文件中查看所有的标签,如TI、AU、GD等等。
• 其中常用的标签有: • [ TI]表示标题, • [AU]表示作者, • [CD]表示参考文献, • [ DE]表示关键词。
BibexceJ有8个菜单
3字段提取-作者字段提取
以;隔开
点击
AU、TI、DE等字段
第一列文章编号 第二列作者名
3字段提取-参考文献字段提取
重命名
重命名
3字段提取-标题字段提取
空格划分
空格切分后的 标题词
4共现分析-.out→.cit(频率计算)
• 第一步 在文件管理系统中选择OUT文件。 • 第二步 在“Select type of Unit”下拉框中,选择计数单位,如
4共现分析-提取字段按降序排列
选whole strings 并将序排列
降序排列的作者 数字是文章数量
频数分布栏: 分析作者共现,选择“Author” 分析关键词共现,选择“whole strings”
分析机构共现,“whole strings” 分析被引期刊共现,“whole strings”
分析参考文献共现,“Cite reference”
BIBEXCEL简介
福州大学情报学
目录
概述 工作界面 数据准备
4 Pajek可视化
发展简史
Bibexcel是瑞典于默奥大学(Umea University) 信息研究小组(The Information Research Group,Inforsk)欧莱·皮尔逊教授设计开发的一 款软件。Bibexcel的设计宗旨是辅助用户分析 书目数据,或者格式相近的自然语言文本,最 终产生的数据可导出至Excel或其他采用【Tab 】键隔开数据的程序中。主要用于文献计量分 析,并可为Pajek、NetDraw软件提供绘图所用 数据
4标题词共现分析-.cit→.coc
• 共现:两个或者两个以上标目在同一个字段中出现 • 第一步 在“Select file here”中选中cit文件,点击“View file”按钮,
在The List中显示cit文件的内容。 • 第二步 从cit文件列表中标记将要分析的单元,然后从菜单条中选择
Mapping菜单
生成net文件 生成vec文件 生成clu文件 从net文件中生成vel文件 合并net文件 生成地理图谱
Help菜单
Help菜单可以调出Bibexcel的帮助文件 帮助文件只有在—Windows 7以下版本的机器上才能打开
数据准备
“共词分析法”属于内容分析法的一种, 主要 统计一组词中两两同时出现于一篇文献的次数 ,以这种“共现”次数反映这些词之间的关联 程度,两个词的“共词强度”(指两个词同时 出现于一篇论文中的次数)越高,则这两个词 之间的关联越紧密。
“whole strings”。 • 第三步 在下方的多选框中,选择排序方式,如选择“Sort
descending”,即按降序排列。 • 第四步 在下方的多选框中,选择计算方法,默认的计算方法是
“whole counts”,可以改变为“fractional counts”。 • 第五步 点击“Start”按钮。将会生成*.cit文件。
Edit doc-files菜单
转换大小写 创建多个out文件 [压缩out文件(每字段一行)] 转换以逗号分隔格式的地址 压缩out文件 压缩独立的空out文件 删除低频项 删除高频项 从引文中抽取出版年 给字符串编号 增加分号 保留0-9及A-Z的字符 保留作者首字母 保留前n个字符 Levenshtein距离计算 只列出out文件中的实词等
Analyze-->Co-occurrence-->Select units via listbox • 第三步 在“Select file here”标记OUT文件。注意:不要在The List中
显示OUT文件。 • 第四步 从菜单中选择
Analyze-->Co-occurrence-->Make pairs via listbox
主要功能
Bibexcel软件主要功能包括文献计量、引文分析、书目耦合、聚类分析,为Pajek、NetDraw软件提供书 目数据等。
下载
崔雷的博客
/blog-82196-271364.html
工作界面
文件位置栏 频数分布栏
标签栏
列表框栏
划分方法栏 状态栏
感谢聆听
汇报人:周婷
继续可视化
5作者共现全矩阵
6导出数据
• 创建供pajek软件使用的文件 • 文件有三种类型:net、vec和clu
6导出数据
• 创建net文件 • 第一步 选择*.coc文件。 • 第二步 从菜单条中选择 Mapping-->Create net-file for
pajek...
6导出数据.net
操作流程
数据转换 (.txt→.txt2→.doc)
字段抽取 (.doc→.out)
共现分析(作者、关键词) .coc→.ccc→.ma2
可视化图谱 Pajek、NetDraw
1 数据准备 wos
1 数据准备 cnki
• Notexpress等文献管理软件 • 导出NE:导出题录(RIS格式) • AU、DE等,不能分析参考咨询CD字段
Analyze菜单
增加频次 共现分析 doc文件中的引用 doc文件及单元格矩阵 h指数 成对单元格 使用MDS生成矩阵 生成包括零词对的词对列表 从词对列表中选择词对 选择最强联系 共享单位/耦合 每记录的单位 词对的滞后年等
Misc菜单-杂项
转换格式 解压csvall格式为Diva原始 数据 解压标签格式数据为Diva 原始数据 按ISSN号进行Sherpa Romeo检索 按期刊名称进行Sherpa Romeo检索
6导出数据
• 创建vec文件 • 第一步 选择*.cit文件。 • 第二步 从菜单条中选择 Mapping-->Create vec-file
6导出数据.vec
Pajek可视化
4 Pajek可视化
4 Pajek可视化
4 示例
总结
• txt文件:从Wos中导出的数据文件; • tx2文件:转换txt文件格式第一步生成的文件; • doc文件:生成的Bibexcel可处理的文件格式; • out文件:抽取只包含需要分析的记录所生成的的文件; • oux文件:对out文件中记录去重后产生的新的文件; • cit文件:对out或oux文件内容按频数或者频率次序排列的文件; • coc文件:统计需要分析的记录共现次数生成的文件; • ccc文件:统计coc文件中需要分析的记录出现的次数生成的文件; • ma2文件:生成的需要分析的记录的共现矩阵文件。
界面左上部分显示了文件名称和路径,默的路径是bibexcel.exe程序所在的目录。 选中某个文件,单击下方的View whole file按钮,就会在界面右下部分显示文件内容。
文件夹
文件
文件内容
划分方法栏
• CR表示参考文献 • Any表示按;(分号)划分整个字段 • JN-表示期刊 • Blank表示按空格划分整个字段 • Whole表示不进行具体的划分,
整个字段是一个整体单元。
频数分布栏
• 后面进行某一字段的具体分析时 会用到这个部分
• Sort表示降序排列 • Remove表示去重 • Make表示输出一个新的gut文件 • Fractionalize表示用频率表示
具体划分为很多字段,如所有字段、被引文献字段、 被引作者字段、被引年字段、被引期刊字段等
概述
主要特点
Bibexcel是一款供学术非营利使用的免费软件,其主要特点是小巧实用、功能丰富。
运行环境
Bibexcel.exe软件可以从Bibexcel官方网站(网址:www.umu.se/inforsk)上进行下载。其帮助文档 bibexcel.hlp和t也可以在该官方网站上进行下载。 在Windows运行环境中,将下载后的EXE到任意目录下,双击即可运行。在安装过程中,如果提示需要 安装附加内容,可按照提示在网上下载。
• 第一步 在文件管理系统中选择DOC文件; • 第二步 在“Old tag”文本框中键入字段标识符,如AU、DE等。 • 第三步 在“Select field to be analysed”下拉框中,选择识别字段内容的
操作,如“Any;separated field”等。 • 第四步 点击“prep”按钮。就完成了OUT文件的创建。
2数据转换-转换tx2文件
操作中如无说明,弹出对话框一律选确定或是
2数据转换-转换doc文件
.doc是Bibexcel可处理的格式