工具函数 · 91/107
1. 抽象工厂模式 2. Adapter Pattern 3. Adapter Pattern 4. 实现一个支持柯里化的 add 函数 5. 计算两个数组的交集 6. 数组中的数据根据key去重 7. 实现一个add方法完成两个大数相加 8. 大数相加 9. bind、call、apply 的区别与实现 10. Bridge Pattern 11. Builder Pattern 12. 实现一个管理本地缓存过期的函数 13. 缓存代理 14. 转化为驼峰命名 15. 实现 (5).add(3).minus(2) 功能 16. 咖啡机进阶优化 17. 咖啡机状态管理 18. 常用设计模式总结 19. 咖啡机状态切换机制 20. 查找数组公共前缀(美团) 21. 实现一个compose函数 22. 并发请求调度器 23. 组合模式 24. 实现 console.log 代理方法 25. Decorator Pattern 26. 实现防抖和节流 27. 实现一个JS函数柯里化 28. 实现防抖函数(debounce) 29. Decorator Pattern 30. 手写深度比较isEqual 31. 消除 if-else 条件判断 32. 修改嵌套层级很深对象的 key 33. 设计模式应用 34. 验证是否是邮箱 35. 实现发布订阅模式 36. 外观模式 37. Facade Pattern 38. Factory Pattern 39. 工厂模式 40. 工厂模式实现 41. Flyweight Pattern 42. 前端常用设计模式与场景 43. 提取对象中所有value大于2的键值对 44. 用正则实现根据name获取cookie中的值 45. 获取今天的日期 46. ES6 之前的迭代器模式 47. 实现 getValue/setValue 函数来获取path对应的值 48. 验证是否是身份证 49. 迭代器模式 50. jQuery slideUp 动画队列堆积问题 51. 实现一个JSON.parse 52. 实现 LazyMan 任务队列 53. 实现一个JSON.stringify 54. 实现lodash的chunk方法--数组按指定长度拆分 55. 字符串最长的不重复子串 56. LRU 缓存算法 57. 查找字符串中出现最多的字符和个数 58. new 操作符的实现原理 59. 中介者模式 60. 中介者模式 61. 对象数组如何去重 62. 千分位格式化 63. 实现观察者模式 64. 观察者模式实例 65. 观察者模式 66. 实现观察者模式 67. 实现 padStart() 和 padEnd() 的 Polyfill 68. 判断是否是电话号码 69. Proxy Pattern 70. 代理模式:婚介所 71. Proxy Pattern 72. 代理模式 73. 实现上拉加载和下拉刷新 74. 生成随机数组并排序 75. 大文件断点续传实现 76. 使用 setInterval 模拟实现 setTimeout 77. 重构询价逻辑 78. 实现一个简单的路由 79. setTimeout 模拟实现 setInterval 80. RGB 转 Hex 颜色转换 81. setTimeout与setInterval实现 82. Simple Factory Pattern 83. 实现单例模式 84. 实现一个 sleep 函数 85. 状态模式 86. State Pattern 87. 策略模式 88. Strategy Pattern 89. Storage 单例封装 90. 策略模式 91. 计算字符串字节长度 92. 字符串压缩算法实现 93. 字符串查找 94. 字符串去除前后空格 95. 实现模板引擎 96. 实现千位分隔符 97. 实现模板字符串解析功能 98. 实现一个函数判断数据类型 99. Promise 实现红绿灯交替 100. 实现节流函数(throttle) 101. 从指定数据源生成长度为 n 的不重复随机数组 102. 解析 URL Params 为对象 103. URL 验证 104. 判断括号字符串是否有效 105. 虚拟代理 106. 访问者模式 107. 版本号排序的方法

计算字符串字节长度

编写方法计算字符串的字节长度,区分中英文字符

问题

编写一个方法,计算字符串的字节长度。假设英文字符占 1 个字节,中文字符占 2 个字节。

解答

方法一:遍历判断字符编码

function getByteLength(str) {
  let length = 0;
  for (let i = 0; i < str.length; i++) {
    // charCodeAt 返回字符的 Unicode 编码
    // ASCII 字符编码范围是 0-127
    if (str.charCodeAt(i) > 127) {
      length += 2; // 非 ASCII 字符算 2 个字节
    } else {
      length += 1; // ASCII 字符算 1 个字节
    }
  }
  return length;
}

// 测试
console.log(getByteLength('hello'));      // 5
console.log(getByteLength('你好'));        // 4
console.log(getByteLength('hello你好'));   // 9

方法二:正则替换

function getByteLength(str) {
  // 将非 ASCII 字符替换为两个占位符,再计算长度
  return str.replace(/[^\x00-\x7f]/g, 'aa').length;
}

// 测试
console.log(getByteLength('hello'));      // 5
console.log(getByteLength('你好'));        // 4
console.log(getByteLength('hello你好'));   // 9

方法三:使用 TextEncoder(UTF-8 真实字节)

function getByteLength(str) {
  // TextEncoder 默认使用 UTF-8 编码
  // UTF-8 中,中文字符占 3 个字节
  return new TextEncoder().encode(str).length;
}

// 测试
console.log(getByteLength('hello'));      // 5
console.log(getByteLength('你好'));        // 6 (UTF-8 中每个中文 3 字节)
console.log(getByteLength('hello你好'));   // 11

方法四:使用 Blob

function getByteLength(str) {
  // Blob 默认使用 UTF-8 编码
  return new Blob([str]).size;
}

// 测试
console.log(getByteLength('hello'));      // 5
console.log(getByteLength('你好'));        // 6
console.log(getByteLength('hello你好'));   // 11

关键点

  • charCodeAt() 返回字符的 Unicode 编码,ASCII 字符范围是 0-127
  • 方法一和方法二适用于「中文 2 字节」的业务场景(如数据库字段限制)
  • 方法三和方法四计算的是 UTF-8 真实字节长度(中文 3 字节)
  • \x00-\x7f 是 ASCII 字符的十六进制范围
  • 根据实际业务需求选择合适的计算方式