-
干货分享:据说这是史上最全的大数据分析工具
所属栏目:[大数据] 日期:2021-01-25 热度:84
副标题#e# 大 数 据 人 报道DT时代应用资讯及动态,爆料剖析行业热点新闻 据说这是史上最全的大数据分析工具,拿走,不谢! 数据可视化工具: 百度ECharts:http://echarts.baidu.com/ Cytoscape:http://www.cytoscape.org/ 图表秀:http://www.tubiaoxiu.[详细]
-
计算社会初探
所属栏目:[大数据] 日期:2021-01-25 热度:164
“计算社会科学”的学科概念已提出四年多,但国内信息科学界的很多学者认为计算社会科学基本等同于社会计算,或者干脆将计算社会科学看作社会计算的一部分,我认为为计算社会科学与社会计算之间确有交叉,但两者同时也有不同的侧重面向。社会计算关注的重点有[详细]
-
大数相除算法
所属栏目:[大数据] 日期:2021-01-25 热度:112
简介 在实际的项目中,同事在移植一个算法时候碰到要进行64位整数的除法运算。找了一下一下,Linux内核中有支持该运算的函数 do_div() ,该函数在 Linux/arch/arm/include/asm/div64.h 文件中实现。看不太懂其具体的实现方法,于是我就想能不能自己写一个[详细]
-
视音频数据处理入门:FLV封装格式解析
所属栏目:[大数据] 日期:2021-01-25 热度:175
副标题#e# ===================================================== 视音频数据处理入门系列文章: 视音频数据处理入门:RGB、YUV像素数据处理 视音频数据处理入门:PCM音频采样数据处理 视音频数据处理入门:H.264视频码流解析 视音频数据处理入门:AAC音[详细]
-
用大数据分析攻城狮的职业生涯与薪资增长轨迹
所属栏目:[大数据] 日期:2021-01-25 热度:64
提到互联网,尤其是互联网工程师们,人们往往会想到两个词:“高薪”和“高压”。在知乎上一个询问工程师薪资的问题下,一位知友默默的回复:“其实单位时间内工资并不高” ,而这也许道出了许多程序员小伙伴们的心声。 ? ?“精神崩溃的一个最初征兆就是坚[详细]
-
7 款顶级开源 BI(商务智能)软件和报表工具
所属栏目:[大数据] 日期:2021-01-25 热度:118
在这个信息化时代,每分每秒都产生海量数据。在海量数据中,挖掘出有用的数据,并且能以较人性化、直观的方式展示这些数据,变得尤为重要。本文将介绍 7款顶级开源 BI(商务智能)软件和报表工具,用于商业数据的分析处理,希望对您有所帮助。 BIRT BIRT(B[详细]
-
数据处理之—reshape2
所属栏目:[大数据] 日期:2021-01-25 热度:152
reshape2是用来做数据处理的拓展包,它可以用来实现宽格式数据与长格式数据之间的互转。如果你熟悉结构化数据库查询,那你一定知道列转行与行转列,我这里所说的宽长数据之间互转与之类似;如果你不熟悉的也没关系,它很简单,接着往下看你就能很快熟悉并[详细]
-
UVA 11582 巨大数的斐波那契数列 (大数取模,幂取模,模的计算方
所属栏目:[大数据] 日期:2021-01-25 热度:199
Problem F: Colossal Fibonacci Numbers! The?i'th Fibonacci number?f?(i)?is recursively defined in the following way: f?(0) = 0?and?f?(1) = 1 f?(i+2) = f?(i+1) + f?(i)??for every?i?≥?0 Your task is to compute some values of this sequence.[详细]
-
【1】文本挖掘的主要概念
所属栏目:[大数据] 日期:2021-01-25 热度:99
转自 NLP论坛 http://www.threedweb.cn/thread-1281-1-1.html 什么是文本挖掘 文本挖掘可以广义地定义知识密集的处理过程,其中用户使用一套分析工具与文档集合动态(随着时间的推移)交互。在类似于数据挖掘的方式,文本挖掘旨在通过识别令人感兴趣的模式[详细]
-
【3】 文本挖掘方法论
所属栏目:[大数据] 日期:2021-01-25 热度:117
副标题#e# 转自 NLP论坛 http://www.threedweb.cn/thread-1284-1-1.html http://www.threedweb.cn/thread-1285-1-1.html http://www.threedweb.cn/thread-1286-1-1.html 文本挖掘流程 第1阶段:确定研究目的 像任何其他项目一样,文本挖掘的研究开始于研究[详细]
-
【4】构建基于scikit-learn的文本挖掘学习系统
所属栏目:[大数据] 日期:2021-01-25 热度:62
转自 NLP论坛 http://www.threedweb.cn/thread-1293-1-1.html 配置开发环境 构建基于scikit-learn的文本挖掘学习系统 1. 下载和安装 python-2.7.8 for win322. 下载和安装 numpy-1.9.0-win32-superpack-python2.73. 下载和安装 scipy-0.14.0-win32-superpa[详细]
-
以色列大数据分析创企CoolaData获560万美元B轮融资,Salesforce
所属栏目:[大数据] 日期:2021-01-25 热度:81
点击上方蓝色字体关注。 您还可以搜索公众号“ D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数据,CIO,企业协作,网络数通,信息安全,企业移动应用,系统集成,服务器,存储,呼叫中心,视频会议,视频监控等)的子公众号。 ======= 企业需[详细]
-
大数的四则运算
所属栏目:[大数据] 日期:2021-01-25 热度:136
项目名称:《大数的四则运算》 ? 开发环境:windows、vs2013 ? 开发技术:string、c++? ? 项目描述: ● 大数计算的底层采用string存储,将整形数据转换成字符串进行存储和运算? ● 运算的加减采用逐位加减,设置标记位,标记每一次加减的进位与借位,每[详细]
-
未来的信息化,就是挖掘企业数据、提升战略决策
所属栏目:[大数据] 日期:2021-01-25 热度:131
企业的发展,离不开信息化的支撑。 不少企业在推进信息化进程过程中,会遇到这样的问题:开发效率低;业务需求多样且紧迫、系统多,开发人员学习困难。久而久之就会形成企业的信息数据壁垒,领导不能及时查看企业运营状况。 那么该如何解决这类问题呢? 这[详细]
-
都想搞个大数据 挖掘更多创造数据的渠道更重要
所属栏目:[大数据] 日期:2021-01-25 热度:95
点击上方蓝色字体关注。 您还可以搜索公众号“ D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数据,CIO,企业协作,网络数通,信息安全,企业移动应用,系统集成,服务器,存储,呼叫中心,视频会议,视频监控等)的子公众号。 ======= 现在大[详细]
-
日均请求量百亿级数据处理平台的容器云实践
所属栏目:[大数据] 日期:2021-01-19 热度:67
from:?http://geek.csdn.net/news/detail/97887 声明:本文为CSDN原创投稿文章,未经许可,禁止任何形式的转载。? 作者:袁晓沛,目前在七牛云的主要工作是基于容器平台构建分布式应用,借助容器的优势,实现大规模分布式应用的自动化运维以及高可用,以Pa[详细]
-
阶乘的精确值(大数)
所属栏目:[大数据] 日期:2021-01-18 热度:175
首先确定阶乘的位数。 我们知道整数n的位数的计算方法为:log10(n)+1 故n!的位数为log10(n!)+1 ? 如果要求出n!的具体值,对很大的n(例如n=1000000)来说,计算会很慢,如果仅仅是求阶乘的位数,可以用斯特林(Stirling)公式求解 ? 斯特林(Stirling)公式[详细]
-
DB、ETL、DW、OLAP、DM、BI关系结构图
所属栏目:[大数据] 日期:2021-01-18 热度:98
(1)DB/Database/数据库——这里一般指的就是OLTP数据库,在线事物数据库,用来支持生产的,比如超市的买卖系统。DB保留的是数据信息的最新状态,只有一个状态!比如,每天早上起床洗脸照镜子,看到的就是当时的状态,至于之前的每天的状态,不会出现的你[详细]
-
连续属性离散化
所属栏目:[大数据] 日期:2021-01-18 热度:194
1. 离散化技术分类 连续属性的离散化方法也可以被称为分箱法,即将一组连续的值根据一定的规则分别放到其术语的集合中。 离散化技术可以根据如何对数据进行离散化加以分类,可以根据是否使用类信息或根据进行方向(即自顶向下或自底向上)分类。 如果离散化[详细]
-
开源ETL工具kettle系列之增量更新设计
所属栏目:[大数据] 日期:2021-01-18 热度:195
副标题#e# 前言 ETL中增量更新是一个比较依赖与工具和设计方法的过程,Kettle中主要提供Insert / Update 步骤,Delete 步骤和Database Lookup 步骤来支持增量更新,增量更新的设计方法也是根据应用场景来选取的,虽然本文讨论的是Kettle的实现方式,但也许[详细]
-
开源大数据查询分析引擎现状
所属栏目:[大数据] 日期:2021-01-18 热度:88
文|叶蓬 【按:此文是与我的《基于大数据分析的安全管理平台技术研究及应用》同期发表在内刊上的我的同事们的作品,转载于此。这些基础性的研究和测试对比分析,对于我们的BDSA技术路线选定大有帮助。】 引言 大数据查询分析是云计算中核心问题之一,自从G[详细]
-
【数位DP】HDU3565-Bi-peak Number
所属栏目:[大数据] 日期:2021-01-18 热度:108
题目链接:http://acm.split.hdu.edu.cn/showproblem.php?pid=3565 Problem Description A peak number is defined as continuous digits {D0,D1 … Dn-1} (D0 0 and n = 3),which exist Dm (0 m n - 1) satisfied Di-1 Di (0 i = m) and Di Di+1 (m = i n[详细]
-
LightOJ1282 Leading and Trailing 大数取首尾
所属栏目:[大数据] 日期:2021-01-18 热度:160
任何一个数都可以转换为10^k,k是一个小数,k的整数部分决定了这个数的位数,小数部分决定了每一位的值,根据此可以快速找到前三位。 通过快速幂取模可以快速找到后三位。 题目链接:http://acm.hust.edu.cn/vjudge/problem/26992 #pragma comment(linker,[详细]
-
数据处理之——data.table
所属栏目:[大数据] 日期:2021-01-18 热度:66
副标题#e# data.table简介 关于 R 中的数据处理,我们接着介绍 data.table 包。上期我们介绍的 dplyr 有类似于sql的一套数据处理的语法,而 data.table 则有着它自己的一套语法,它能处理几乎所有 dplyr 可以处理的数据,而且代码量更少,效率更高,特别是[详细]
-
如何计算文档相似性
所属栏目:[大数据] 日期:2021-01-18 热度:78
最近课题需要,整理一下文档相似性的一些研究,主要是参考知乎上面的回答和52nlp的相关文章。以备后期综述使用。具体还需要好好细读链接。 主要思路 01/one hot representation,BOW+tf-idf+LSI/LDA体系. docsim方法:gensim包,使用corpora.Dictionary(te[详细]