elasticsearch 索引数据快照备份和恢复
admin
2023-03-01 09:42:14
0

最近线上的ES集群埋点数据量暴涨,机器的内存磁盘空间眼看就要炸了。但这部分数据又是冷数据,现时不需要查询,但又不能直接delete,需保留日后数据分析。由于前期急于上线,业务代码没有合理分配索引按月切割,全年数据丢进单个索引,导致单索引数据暴涨到100G+
为解决磁盘空间的瓶颈,针对不常用的分片数据,做快照冷存储。
应用场景:
三节点的ES集群:192.168.85.39 ,192.168.85.36,192.168.85.33

找一台有磁盘空间的服务器,搭建NFS,用于共享目录挂载。已192.168.85.63为例

应用场景:ES集群三节点 192.168.85.39,192.168.85.33,192.168.85.36
NFS存储服务器:192.168.5.63

一.搭建NFS共享存储服务器 (5.63上操作)

1.安装 nfs服务  
yum install -y nfs-utils

2. 开机启动
systemctl enable rpcbind.service
systemctl enable nfs-server.service

3.  分别启动rpcbind和nfs服务:
systemctl start rpcbind.service
systemctl start nfs-server.service

4.firewalld 防火墙针对es节点内网ip开放NFS服务监听端口:
111 udp端口    20048 tcp端口    2049 tcp 和 udp全开

5.创建本地数据共享目录 并设置权限  
mkdir /data/db/elasticsearch/backup
chmod 777 /data/db/elasticsearch/backup
chown -R elasticsearch:elasticsearch /data/db/elasticsearch/backup

6.配置NFS目录访问权限
vim etc/exports
/data/db/elasticsearch/backup 192.168.85.39(rw,sync,all_squash)     192.168.85.33(rw,sync,all_squash) 192.168.85.36(rw,sync,all_squash)
exports -r //生效
exports -s //查看

7.es节点上安装客户端(85.39 85.33 85.36 上操作)
     yum -y install showmount
开启服务:
     systemctl enable rpcbind.service
     systemctl start rpcbind.service
8.创建挂载目录(85.39 85.33 85.36 上分别操作)
mkdir /mnt/elasticsearch
chmod 777 elasticsearch

挂载共享目录到本地
mount -t nfs 192.168.5.63:/data/db/elasticsearch/backup  /mnt/elasticsearch

df -h //查看确认是否成功挂载

二.创建快照仓库

curl -XPUT http://192.168.85.39:9002/_snapshot/backup -d'
{
"type": "fs",
"settings": {
"location": "/mnt/elasticsearch/backup",
"compress": true,
"max_snapshot_bytes_per_sec" : "50mb",
"max_restore_bytes_per_sec" : "50mb"
}
}'

备注说明:
1.可在es任一节点操作
2.backup: 指定仓库名称为backup  ,生成的备份文件存放路径为/mnt/elasticsearch/backup
3.max_snapshot_bytes_per_sec,max_restore_bytes_per_sec 限定备份和恢复的数据字节内容大小为50mb,
为了防止磁盘IO过高。数值越大,备份恢复速度越快。50mb为推荐值,IO性能高的机器可不限制

curl -XPUT http://192.168.85.39:9002/_snapshot/backup -d '
{
    "type": "fs",
    "settings": {
        "location": "/mnt/elasticsearch/backup",
        "compress": true
    }
}'

三.创建快照备份
1.针对全索引快照备份

curl -XPUT 192.168.85.39:9002/_snapshot/backup/snapshot_all?pretty

备注说明:
1.指定备份到仓库backup
2.快照名称为 snapshot_all

2.针对指定某个单独索引快照备份(为了区分不同索引备份目录,建议仓库用索引名称命名)

单独快照备份user_event_201810这个索引
2.1先针对索引创建仓库
curl -XPUT http://192.168.85.39:9002/_snapshot/user_event_201810 -d'
{
"type": "fs",
"settings": {
"location": "/mnt/elasticsearch/user_event_201810",
"compress": true,
"max_snapshot_bytes_per_sec" : "50mb",
"max_restore_bytes_per_sec" : "50mb"
}
}'

2.2 快照备份索引user_event_201810操作
curl -XPUT http://192.168.85.39:9002/_snapshot/user_event_201810/user_event_201810?wait_for_completion=true -d '
{
"indices":"user_event_201810",
"ignore_unavailable": "true",
"include_global_state": false
}'

备注说明:
1.创建的仓库名为user_event_201810
2.存放的文件目录为/mnt/elasticsearch/user_event_201810
3.indices:指定索引源为user_event_201810
4.增加?wait_for_completion=true参数是为了执行完成返回结果状态

四.恢复快照备份数据到es集群
1.针对全索引快照备份的恢复操作

curl -XPOST http://192.168.85.39:9200/_snapshot/backup/snapshot_all/_restore

备注说明:
1.指定仓库名称backup
2.指定快照备份名称snapshot_all

2.针对某个指定索引的快照备份恢复操作

针对索引user_event_201810快照恢复
curl -XPOST http://192.168.85.39:9002/_snapshot/user_event_201810/user_event_201810/_restore

备注说明:
1.指定仓库名称user_event_201810
2.指定快照备份名称user_event_201810

五:辅助操作命令
1.查看已存在仓库

curl 192.168.85.39:9002/_cat/repositories?

2.查看已存在快照

curl -XGET http://192.168.85.39:9002/_snapshot?   //查看全部
curl -XGET http://192.168.85.39:9002/_snapshot/user_event_201810/user_event_201810//查看指定索引

3.删除快照

curl -XDELETE http://192.168.85.39:9002/_snapshot/user_event_201810/user_event_201810
//删除快照user_event_201810

4.删除仓库

curl -XDELETE http://192.168.85.39:9002/_snapshot/user_event_201810
//删除仓库user_event_201810

elasticsearch其中一节点配置文件

cluster.name: my-application1
node.name: node-3
path.data: /data/db/elasticsearch
path.logs: /data/log/elasticsearch/logs
path.repo: ["/mnt/elasticsearch"]
network.host: 192.168.85.33
http.port: 9002
transport.tcp.port: 9102
node.master: true
node.data: true
discovery.zen.ping.unicast.hosts: ["192.168.85.39:9102","192.168.85.36:9102","192.168.85.33:9102"]
discovery.zen.minimum_master_nodes: 2
indices.query.bool.max_clause_count: 10240
http.cors.enabled: true
http.cors.allow-origin: "*"

NFS
mount -t nfs 192.168.5.63:/data/db/elasticsearch/backup /mnt/elasticsearch

相关内容

热门资讯

全球单机容量最大!16兆瓦漂浮... 全球单机容量最大的16兆瓦漂浮式海上风电平台“三峡领航号”,近日在广东阳江海域完成海上固定安装,标志...
坚朗五金获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示坚朗五金(002791)新获得一项实用新型专利授权,专利名为“...
揭秘展会大屏:看MES数据联动... 在各大工业展会现场,最吸引眼球的往往是那些流光溢彩、数据飞驰的“数字孪生”大屏。它们实时映射着远方工...
原创 发... 汽车界关于全固态电池的喧嚣似乎已然平息。曾几何时,2024年与2025年的车企新品发布会上,2026...
AI“算力税”该不该征? 近日,对AI算力征税引发讨论。支持者认为,AI税既可以帮助政府获得新的财政收入,也可以通过提高AI使...
韩国宣布延长囤积石油禁令至7月 新华社北京5月8日电 韩国政府7日宣布,将禁止囤积和垄断石油产品的措施延长两个月至7月底,以应对中东...
外媒:涉汉坦病毒疫情邮轮乘客曝... 【环球网报道】据美国全国广播公司(NBC)当地时间5月7日报道,涉汉坦病毒疫情的“洪迪厄斯”号邮轮上...
驴友在川西4600米营地帐篷里...   驴友在川西4600米营地帐篷里去世  【驴友在川西4600米营地帐篷里去世】近日,多名驴友发视频...
“顾客用餐盘喂狗”引争议,多家... 近日,多起顾客在饭店用餐盘、铁签喂狗的视频,引发争议。据荔枝新闻5月6日报道,一网友发视频称,在广东...
谢晓亮追忆科学狂人文特尔:一位... 来源:市场资讯 (来源:知识分子) 克雷格·文特尔(Craig Venter) 撰文|谢晓亮 20...