当前位置: 首页 > article >正文

【Hadoop|MapReduce篇】Hadoop序列化概述

1. 什么是序列化

序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输。

反序列化就是将收到的字节序列(或其他数据传输协议)或者磁盘的持久化数据,转换成内存中的对象。

2. 为什么要序列化

一般来说,“活的”对象只生存在内存中,关机断电就没有了。而且活的对象只能由本地的进程使用,不能被发送到网络上的另外一台计算机。然后序列化可以存储“活的”对象,可以将“活的”对象发送到远程计算机。

3. 为什么不用java序列化

java序列化是一个重量级序列化框架(Serializable),一个对象被序列化后,会附带很多额外的信息(各种校验信息,Header,继承体系等),不便于在网络中高效传输。而hadoop的序列化只是会附带简单的校验,紧凑存储空间少,快速传输速度块。互操作性好。


http://www.kler.cn/news/304426.html

相关文章:

  • LabVIEW FIFO详解
  • 分享六款小众宝藏软件,建议收藏!
  • golang os.Eixt的介绍和使用
  • 【C++】vector常见用法
  • 数字化大屏解决方案 - GoView
  • 如何通俗易懂的解释TON的智能合约
  • DolphinScheduler应用实战笔记
  • ROS2 Control controller_interface说明
  • 论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision
  • LOAM学习
  • camouflaged object detection中的decoder最核心的作用
  • Amazon EC2:灵活、可扩展的云计算解决方案
  • Flutter iOS混淆打包
  • 安卓13禁止声音调节对话框 删除音量调节对话框弹出 屏蔽音量对话框 android13
  • springcloud OpenFeign 日志打印功能
  • java项目之中药实验管理系统(源码+文档)
  • Linux 入门:简单的基础操作
  • 如何优化MySql的性能
  • 亚信软件测试实习面试记录
  • HarmonyOS开发之路由跳转
  • react js 处理表单( form )的2个例子
  • 基于Springboot的鲜花销售网站的设计与实现
  • Git版本控制工具
  • 如何模拟一个小程序项目打包的流程
  • php 实现JWT
  • 用于客户支持的 GenAI:探索 Elastic Support Assistant
  • 如何让Windows控制台窗口不接受鼠标点击(禁用鼠标输入)
  • 前端工程师职业发展路线图
  • MADE A PIE 之动态树形图
  • 解决Docker镜像不可下载