`
bewithme
  • 浏览: 422788 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论
文章列表
数据转换      数据向量的关键工具之一是转换。数据向量帮助用户将数据集从一个概要映射到另一个概要,并提供一个操作列表来转换类型,格式化数据,把一个2D数据集转换成系列数据。   构建一个转换过程      一个转换过程需要一个概要来成功地转换数据。概要和转换过程类都附带一个帮助构建器类,对于组织代码和避免复杂的构建器来说是很有用的。当两者结合起来它们看起来像如下的样例代码。请注意inputDataSchema是如何传到Builder构造器的。没有它,你的转换过程将会编译失败。 import org.datavec.api.transform.TransformProce ...
系列化转换 数据向量附带系列化转换的能力,这允许在生产环境需要转换时它们更加可移植。一个TransformProcess(转换过程)被序列化为一个人类可读的格式,例如JSON,并且可以保存为文件。   系列化 如下这行代码展示了你可以如何系列化转换过程 tp对象 String serializedTransformString = tp.toJson() Deserialization 反系列化 当你想要重新实例化转换过程的时候,调用静态方法fromJson
为什么要使用概要?      现实中的不幸是数据是脏的。当为了深度学习而试图向量化一个数据集时,很少能找到没有错的文件。在使用神经网络训练神经网络之前,概要对于维护数据的意义是很重要的。   使用概要       ...
可用的降维 GeographicMidpointReduction (地理中点降维) [源码] 分割符是可配置的), 决定了地理位置的中点.  在: http://www.geomidpoint.com/methods.html 查看 “地理中点”实现算法, 查看: http://www.geomidpoint.com/calculation.html   转换 public Schema transform(Schema inputSchema) 参数delim是文本中坐标分割符. 例如, 如果格式是 “lat,long” 则使用 “,” St ...
什么是记录?     在数据向量的世界里,记录代表一个数据集里的单个条目。数据向量区分记录的类型以便在内置的API中使得数据操作更容易。序列和2D记录是可区分的。 使用记录     大多数时间你不需要与记录类直接交互,除非你要手动迭代记录,以便通过神经网络进行转发。   记录类型 记录 [源码] 序列记录 [源码]               有任何问题请联系微信 
数据向量:一个向量化的ETL(抽取、转换和加载)库       数据向量解决了有效机器或深度学习的最重要障碍之一:将数据转换成神经网络可以理解的格式。神经网络理解向量。向量化是数据科学家开始在数据上训练他们算法 ...
参数层空间 布尔空间 [源码] 如果参数被设置的值小于或等于0.5它将返回true,否则是false。 固定值 [源码] 固定值是只定义单个固定值的参数空间。 连续型参数空间 [源码] getValue
层空间 激活层空间 [源码] 自编码器层空间 [源码] 用于自编码器的层空间 批量规一化空间 [源码] 用于批量规一化的层空间 双向的
超参数优化       机器学习有一个参数集合,必须在任何训练开始之前选择。 这些参数就是所谓 的超参数。  一些超参数的例子是K邻近值算法的“K”和支持向量机中的正则化参数。  神经网络,比较特别,有很多的超参数。它们中的一些定义了神经网络的结构,像层的数量和它们的大小。其它一些定义了学习过程比如说学习率和正则化传统上,这些选择是根据现有的经验法则做出的,或者经过大量的试验和错误后做出的,这两者都不太理想。 无疑的这些参数选择会在学习取得的结果上有重要影响。 超参数优化尝试使用应用搜索策略的软件自动化该过程。   Arbiter(阿比特)      阿比特是企业机器学习/深度学习工 ...
      在tomcat 7.0.78 以下的版本中运行正常的项目在tomcat 7.0.78中报以下错误   Initial cause was Error configuring from input stream. Initial cause was null:111       初步怀疑是ehcache版本与tomcat 7.0.78有兼容性问题,后来检查发现项目中有多个版本的ehcache存在,果断删除多出的ehcache包,问题解决。
         poi-scratchpad  包中提供了ExcelToHtmlConverter工具类可以实现xls文件转换为html的功能,但是无法实现xlsx转html。        本代码重写了一遍ExcelToHtmlConverter,实现了xlsx转html。入口类为XssfExcelToHtmlConverter  可以直接使用这个类中的main方法进行测试。源码在附件中,只要修改相应的包名即可,还要引入poi-scratchpad 和poi包。   public static void main( String[] args )throws IOExcept ...
      原文    https://stackoverflow.com/questions/13859780/building-a-query-using-not-exists-in-jpa-criteria-api   SELECT table1 FROM table1 table1 WHERE NOT EXISTS (SELECT table2 FROM table2 table2 WHERE table2.name = table1.name ...

kafka简介

简介Apache Kafka® 是一个分布式流媒体平台。它切确的含义是什么?我们认为流媒体平台有三个关键功能:1.它可以让你发布和订阅流记录。在这方面,它类似于一个消息队列或企业消息系统。2.它允许你以一个容错方式存储流记录。3.它可以让你在流记录发生时处理它们。Kafka的优点是什么?它被两大类应用所使用:构建实时的流数据管道,实时地在系统之间或应用之间获取数据。 构建实时的应用,转换或响应流数据。为了理解Kafka如何做这些事情,让我们自下而上的深入探究 Kafka的能力。首先一些概念:Kafka在一台或多台服务器上作为集群运行。Kafka集群按分类存储流记录叫作主题。每条记录由键,值, ...
         该文档对应的是 kafka安装目录/config/consumer.properties文件的内容,此份配置是老版本的kafka。由于原英文版的文档从句太多太难理解,我花了四天时间翻译了一份中文文档,希望给大家带来帮助,有问题请留言。可能网页显示不全,请下载附件PDF。   名称 默认 描述 group.id  
       该文档对应的是 kafka安装目录/config/consumer.properties文件的内容,也是适用于java客户端。由于原英文版的文档从句太多太难理解,我花了四天时间翻译了一份中文文档,希望给大家带来帮助,有问题请留言。 可能网页显示不全,请下载附件PDF。   名称 描述 类型 默认值 可用值
Global site tag (gtag.js) - Google Analytics