当前位置: 首页 > article >正文

【Hadoop|MapReduce篇】Hadoop序列化概述

1. 什么是序列化

序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议)以便于存储到磁盘(持久化)和网络传输。

反序列化就是将收到的字节序列(或其他数据传输协议)或者磁盘的持久化数据,转换成内存中的对象。

2. 为什么要序列化

一般来说,“活的”对象只生存在内存中,关机断电就没有了。而且活的对象只能由本地的进程使用,不能被发送到网络上的另外一台计算机。然后序列化可以存储“活的”对象,可以将“活的”对象发送到远程计算机。

3. 为什么不用java序列化

java序列化是一个重量级序列化框架(Serializable),一个对象被序列化后,会附带很多额外的信息(各种校验信息,Header,继承体系等),不便于在网络中高效传输。而hadoop的序列化只是会附带简单的校验,紧凑存储空间少,快速传输速度块。互操作性好。


http://www.kler.cn/a/304426.html

相关文章:

  • 动态规划<四> 回文串问题(含对应LeetcodeOJ题)
  • 5QI DSCP映射
  • Linux -- 线程的优点、pthread 线程库
  • Redis篇--常见问题篇6--缓存一致性1(Mysql和Redis缓存一致,更新数据库删除缓存策略)
  • react中使用ResizeObserver来观察元素的size变化
  • 人工智能:人机交互和用户体验:相关学点、两者关系、未来趋势
  • LabVIEW FIFO详解
  • 分享六款小众宝藏软件,建议收藏!
  • golang os.Eixt的介绍和使用
  • 【C++】vector常见用法
  • 数字化大屏解决方案 - GoView
  • 如何通俗易懂的解释TON的智能合约
  • DolphinScheduler应用实战笔记
  • ROS2 Control controller_interface说明
  • 论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision
  • LOAM学习
  • camouflaged object detection中的decoder最核心的作用
  • Amazon EC2:灵活、可扩展的云计算解决方案
  • Flutter iOS混淆打包
  • 安卓13禁止声音调节对话框 删除音量调节对话框弹出 屏蔽音量对话框 android13
  • springcloud OpenFeign 日志打印功能
  • java项目之中药实验管理系统(源码+文档)
  • Linux 入门:简单的基础操作
  • 如何优化MySql的性能
  • 亚信软件测试实习面试记录
  • HarmonyOS开发之路由跳转