自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

MaoLin Tian's Blog

from Bird to God(mdzz的直译)

原创 【分布式集群搭建 二】克隆虚拟机并配置集群

在上一篇blog-【分布式集群搭建 一】虚拟机配置(VMware+Centos7+SecureCRT+AppNode)里讲到了如何创建一个虚拟机,在此基础之上,如果我们在虚拟机里部署了ElasticSearch、Kafka等等并且改了一堆配置之后,我们肯定不希望在其它机器上再搞一遍,所以克隆虚拟机...

2020-08-30 18:47:33 54 0

原创 【分布式集群搭建 一】虚拟机配置(VMware+Centos7+SecureCRT+AppNode)

环境准备的时候我决定使用VMware+Centos7+SecureCRT+AppNode的方式来搭建和管理虚拟机。 1 安装VMware 直接从VMware官方网站上下载即可:下载时选择左边的,我下载的时候最新版本为15.5(2020.8.30). 下载完成后直接按默认安装流程安装即可。 2 下...

2020-08-30 17:30:29 68 0

原创 【实用工具指南 二】视频剪辑工具

花了点时间研究了下视频剪辑,其实没有必要下载会声会影这么复杂的软件,如果只是简单的处理,推荐一个软件叫做【万兴喵影】,这个软件就是入门级的视频剪辑软件。 下载完成后,操作界面非常简洁明了: 可以直接裁剪片段 可以定义视频的倍速: 还有设置转场效果等等,剪辑完成后导出如果去水印是需要会员的。...

2020-08-30 15:42:59 33 0

原创 【实用工具指南 一】OCR图片识别自动翻译原文替换

最近收到家里上级的一项任务,把一个图片上的英文翻译成中文,并且做出一个一样的表格来,看起来东西不多,也就是一个小卡片: 如果按照正常的流程就是: 1,整个word文件,照猫画虎整个大致表格出来,把小人粘贴上去 2,把表格里的英文全部翻译成中文 3,把word截个图整出来 显然这种方式太笨了,...

2020-08-30 15:27:55 83 0

原创 【ElasticSearch从入门到放弃系列 七】Spring Data Elasticsearch的使用

上一篇blog介绍了如何通过java客户端来操作ES,可以看到,操作还是很繁琐的,需要连接集群、开启客户端连接等一系列繁琐的动作,在正式介绍前,先了解下概念 Spring Data:Spring Data 项目的目的是为了简化构建基于 Spring 框架应用的数据访问计数,包括非关系数据库、Ma...

2020-08-24 09:51:04 50 0

原创 【ElasticSearch从入门到放弃系列 六】Java客户端操作ElasticSearch

我们知道ES的操作方式有两种,一种是http风格的,一种是tcp风格的,http风格的我们可以通过发送请求去进行索引的增删改查等操作、tcp风格的处理方式则需要我们编码去调用实现,由于ES本身是基于Lucene,而Lucene又是Java的开源搜索引擎,所以我们用Java语言去实现ES的调用。 环...

2020-08-20 10:11:13 56 0

原创 【ElasticSearch从入门到放弃系列 五】ElasticSearch分布式集群搭建

上一篇blog介绍了ES的原理和基本使用方法,因为ES最厉害的地方就在于PB级别准实时的搜索能力,当然PB级的数据对于单个服务器去存储和检索还是很有难度的,所以ES一般使用时都使用分布式集群搭建。 分布式相关概念 级别 概念 集群 cluster 一个集群就是由一个或多个节点组织在...

2020-08-19 09:26:27 53 0

原创 【ElasticSearch从入门到放弃系列 四】ElasticSearch的基本概念和使用

上一篇blog详细介绍了lucene的基本概念和使用,本篇blog介绍的就是其工业级的应用ElasticSearch。也就是系列文章的主题。Elaticsearch,简称为es, es是一个开源的高扩展的分布式全文检索引擎,它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处...

2020-08-18 10:21:04 46 0

原创 【ElasticSearch从入门到放弃系列 三】Lucene的基本概念和使用

上一篇blog介绍了全文检索的实现思路,这一篇呢主要介绍开源的搜索引擎Lucene是如何基于这样的思路来进行具体的实现的。 Lucene基本概念 Lucene是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分...

2020-08-15 14:44:27 48 0

原创 【Cassandra从入门到放弃系列 三】Cassandra的数据模型设计

前两篇分别介绍了为什么要使用NoSql数据库及为什么选用Cassandra作为业务数据库以及其基于列的存储模式对于处理海量数据聚合计算的优势,本篇详细说明下Cassandra的数据模型是如何设计的? 数据模型设计 数据模型中有如下几个概念:Column,Super Column,Column Fa...

2020-08-14 09:46:02 663 0

原创 【Cassandra从入门到放弃系列 二】Column-based存储模式

在正式的了解Cassandra之前,有必要了解下Cassandra的存储模式,即Column-based存储模式。典型的 NoSql按数据存储方式主要分为三类: Key-Value数据库,如Redis,Key-Value数据库会以键值对的方式来对数据进行存储。其内部常常通过哈希表这种结构来记录数...

2020-08-11 13:25:35 66 0

原创 【ElasticSearch从入门到放弃系列 二】全文检索的实现思路

上一篇全文检索的基本概念讲到了为什么要有全文检索这样的需求,那么有了需求,就有实现,开源的全文检索引擎Lucene应运而生。Lucene的实现流程和原理如下图所示: 上图的执行流程说明如下: 左侧绿色部分表示索引过程,对要搜索的原始内容进行索引构建一个索引库,索引过程包括:确定原始内容即要搜索...

2020-08-02 10:02:20 103 0

原创 【ElasticSearch从入门到放弃系列 一】全文检索基本概念

因为公司的技术栈里,业务数据和日志的搜索使用的是ElasticSearch这一开源项目,学习不能光停留在使用阶段,要搞清楚就搞个彻底。于是自学了ElasticSearch的相关知识,整体的内容学习都遵循这个框架图 分为几个部分从底至上的去学习,可以用如下的方式去理解: 第一阶段:需求的产生:对于...

2020-08-01 11:05:55 87 0

提示
确定要删除当前文章?
取消 删除