博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
karma 持续集成_与Karma进行开源数据集成
阅读量:2520 次
发布时间:2019-05-11

本文共 1127 字,大约阅读时间需要 3 分钟。

karma 持续集成

Karma是一个免费的开源数据集成工具,可轻松将各种格式的数据转换为链接的数据。

我最近与我们的讲师Pedro Szekely一起参加了为期半天的研讨会。 他首先警告我们,他对图书馆知之甚少,但对数据知之甚少。 如果您有兴趣查看我们的研讨会文件,请 。 您可以按照Wiki上的教程步骤进行操作,当然,您也可以在找到Karma本身。

基础

Karma是一种基于Web的工具,可以在您的计算机上同时运行服务器和浏览器,因此我们可以在装有计算机的计算机上使用该工具。

用户加载其应用程序的本体以及每个要转换为Karma的数据文件的数据样本。 Karma通过提供直观的图形用户界面来可视化和编辑数据文件到本体的映射,从而使转换过程变得容易。

Karma具有灵活性,因为它可以从多种数据格式(SQL,XML,JSON,CSV,Excel,AVRO,Web服务)导入数据。

业力可扩展到非常大的数据集(4000万个文档,十亿个三倍),并且可以定期(例如每小时)刷新。

动手

研讨会的其余部分是与Karma的动手经验。

在将一些样本数据加载到Karma之后,我们将其映射到一些本体。 例如,在单击标题字段时,Karma甚至为我们提供了四个可能需要映射到标题的建议。 它知道如何提出此建议,因为该工具可以学习(即使您过去犯过映射错误)。 如果您经常使用相同类型的数据,则可以节省大量时间。 佩德罗确实提醒我们,业力并不知道正确的映射,用户可以选择他们想要的任何东西-即使它是“错误的”。

输入数据后,您可以根据需要使用Python脚本进行清理。 每一列在菜单中都有一个“ PyTransform”选项。 我个人从来没有编写过Python,但是看起来很简单,Pedro向我们保证,在他使用Karma之前,他还不了解Python,但是发现在上已经有人问过他所有的问题。

处理完数据后,您可以生成RDF,MySQL,JSON或许多其他格式以用于Web应用程序。

当我们在列中编辑数据时,Pedro对我们必须选择的一个选项发表了非常有趣的评论。 他说“永远不要这样做”,当被问到这是一个选择时,他说“因为有人要我们添加它”。 当我教人们如何使用开放源代码工具时,我发现这个问题的答案完全相同。 开源充满了功能,仅仅是因为有人要求它。

结论

在这次研讨会之后,我了解到,业力非常强大! 我们那里杂乱无章的数据太多,以至于像这样的工具非常方便-当然,它是开源的,这使其更具吸引力。 我还了解到,每天可能不会真正使用像Karma这样的工具,但是我认识很多人,我希望这个总结对他们有所帮助。

链接/资源

  • 可能的模式(来自我们的教程)

翻译自:

karma 持续集成

转载地址:http://uafzd.baihongyu.com/

你可能感兴趣的文章
Python--eval()函数
查看>>
【转载】Linux下的crontab定时执行任务命令
查看>>
STM32 HAL库的定时器中断回调函数跟串口中断回调函数
查看>>
vs2010找不到ado.net 实体数据模型解决办法
查看>>
(转)深入理解javascript连续赋值表达式
查看>>
用户场景分析
查看>>
MySQL创建数据库及用户
查看>>
Springboot静态页面放在static路径下还是访问不到
查看>>
centos7 重启网卡失败
查看>>
springboot(一)注解
查看>>
07 Mybatis的多表查询1----1对多和多对1
查看>>
debian和ubuntu的sh dash bash
查看>>
java9-8 局部内部类
查看>>
数据库分页
查看>>
Centos6.8源码编译安装PHP7
查看>>
012 debug调试工具的指令
查看>>
慕课网消息的接收与响应3
查看>>
第三十二讲:UML类图(下)
查看>>
linux下更改时区
查看>>
复杂链表的复制
查看>>