工具函数 · 101/107
1. 抽象工厂模式 2. Adapter Pattern 3. Adapter Pattern 4. 实现一个支持柯里化的 add 函数 5. 计算两个数组的交集 6. 数组中的数据根据key去重 7. 实现一个add方法完成两个大数相加 8. 大数相加 9. bind、call、apply 的区别与实现 10. Bridge Pattern 11. Builder Pattern 12. 实现一个管理本地缓存过期的函数 13. 缓存代理 14. 转化为驼峰命名 15. 实现 (5).add(3).minus(2) 功能 16. 咖啡机进阶优化 17. 咖啡机状态管理 18. 常用设计模式总结 19. 咖啡机状态切换机制 20. 查找数组公共前缀(美团) 21. 实现一个compose函数 22. 并发请求调度器 23. 组合模式 24. 实现 console.log 代理方法 25. Decorator Pattern 26. 实现防抖和节流 27. 实现一个JS函数柯里化 28. 实现防抖函数(debounce) 29. Decorator Pattern 30. 手写深度比较isEqual 31. 消除 if-else 条件判断 32. 修改嵌套层级很深对象的 key 33. 设计模式应用 34. 验证是否是邮箱 35. 实现发布订阅模式 36. 外观模式 37. Facade Pattern 38. Factory Pattern 39. 工厂模式 40. 工厂模式实现 41. Flyweight Pattern 42. 前端常用设计模式与场景 43. 提取对象中所有value大于2的键值对 44. 用正则实现根据name获取cookie中的值 45. 获取今天的日期 46. ES6 之前的迭代器模式 47. 实现 getValue/setValue 函数来获取path对应的值 48. 验证是否是身份证 49. 迭代器模式 50. jQuery slideUp 动画队列堆积问题 51. 实现一个JSON.parse 52. 实现 LazyMan 任务队列 53. 实现一个JSON.stringify 54. 实现lodash的chunk方法--数组按指定长度拆分 55. 字符串最长的不重复子串 56. LRU 缓存算法 57. 查找字符串中出现最多的字符和个数 58. new 操作符的实现原理 59. 中介者模式 60. 中介者模式 61. 对象数组如何去重 62. 千分位格式化 63. 实现观察者模式 64. 观察者模式实例 65. 观察者模式 66. 实现观察者模式 67. 实现 padStart() 和 padEnd() 的 Polyfill 68. 判断是否是电话号码 69. Proxy Pattern 70. 代理模式:婚介所 71. Proxy Pattern 72. 代理模式 73. 实现上拉加载和下拉刷新 74. 生成随机数组并排序 75. 大文件断点续传实现 76. 使用 setInterval 模拟实现 setTimeout 77. 重构询价逻辑 78. 实现一个简单的路由 79. setTimeout 模拟实现 setInterval 80. RGB 转 Hex 颜色转换 81. setTimeout与setInterval实现 82. Simple Factory Pattern 83. 实现单例模式 84. 实现一个 sleep 函数 85. 状态模式 86. State Pattern 87. 策略模式 88. Strategy Pattern 89. Storage 单例封装 90. 策略模式 91. 计算字符串字节长度 92. 字符串压缩算法实现 93. 字符串查找 94. 字符串去除前后空格 95. 实现模板引擎 96. 实现千位分隔符 97. 实现模板字符串解析功能 98. 实现一个函数判断数据类型 99. Promise 实现红绿灯交替 100. 实现节流函数(throttle) 101. 从指定数据源生成长度为 n 的不重复随机数组 102. 解析 URL Params 为对象 103. URL 验证 104. 判断括号字符串是否有效 105. 虚拟代理 106. 访问者模式 107. 版本号排序的方法

从指定数据源生成长度为 n 的不重复随机数组

探讨从指定数据源中生成不重复随机数组的多种实现方法及其时间复杂度分析

问题

给定一个数据源数组,如何从中随机抽取 n 个不重复的元素组成新数组?需要考虑多种实现方案,并分析各自的时间复杂度。

解答

方法一:Fisher-Yates 洗牌算法(推荐)

/**
 * 使用 Fisher-Yates 洗牌算法生成不重复随机数组
 * 时间复杂度:O(n)
 * 空间复杂度:O(n)
 */
function getRandomArray1(source, n) {
  if (n > source.length) {
    throw new Error('n 不能大于数据源长度');
  }
  
  // 复制原数组,避免修改原数据
  const arr = [...source];
  const result = [];
  
  // 只需要洗牌前 n 个元素
  for (let i = 0; i < n; i++) {
    // 从剩余元素中随机选择一个索引
    const randomIndex = i + Math.floor(Math.random() * (arr.length - i));
    // 交换当前位置和随机位置的元素
    [arr[i], arr[randomIndex]] = [arr[randomIndex], arr[i]];
    result.push(arr[i]);
  }
  
  return result;
}

方法二:Set 去重法

/**
 * 使用 Set 去重生成不重复随机数组
 * 时间复杂度:O(n) ~ O(n²)(取决于碰撞概率)
 * 空间复杂度:O(n)
 */
function getRandomArray2(source, n) {
  if (n > source.length) {
    throw new Error('n 不能大于数据源长度');
  }
  
  const result = new Set();
  const len = source.length;
  
  // 当 n 接近 source.length 时,效率会降低
  while (result.size < n) {
    const randomIndex = Math.floor(Math.random() * len);
    result.add(source[randomIndex]);
  }
  
  return Array.from(result);
}

方法三:标记法(索引标记)

/**
 * 使用标记法生成不重复随机数组
 * 时间复杂度:O(n)
 * 空间复杂度:O(m),m 为数据源长度
 */
function getRandomArray3(source, n) {
  if (n > source.length) {
    throw new Error('n 不能大于数据源长度');
  }
  
  const result = [];
  const used = new Set(); // 记录已使用的索引
  const len = source.length;
  
  while (result.length < n) {
    const randomIndex = Math.floor(Math.random() * len);
    
    if (!used.has(randomIndex)) {
      used.add(randomIndex);
      result.push(source[randomIndex]);
    }
  }
  
  return result;
}

方法四:数组splice法

/**
 * 使用 splice 删除已选元素
 * 时间复杂度:O(n²)(splice 操作为 O(n))
 * 空间复杂度:O(n)
 */
function getRandomArray4(source, n) {
  if (n > source.length) {
    throw new Error('n 不能大于数据源长度');
  }
  
  const arr = [...source];
  const result = [];
  
  for (let i = 0; i < n; i++) {
    const randomIndex = Math.floor(Math.random() * arr.length);
    // splice 会改变数组长度,时间复杂度 O(n)
    result.push(...arr.splice(randomIndex, 1));
  }
  
  return result;
}

方法五:排序法

/**
 * 先打乱顺序再截取
 * 时间复杂度:O(m log m),m 为数据源长度
 * 空间复杂度:O(m)
 */
function getRandomArray5(source, n) {
  if (n > source.length) {
    throw new Error('n 不能大于数据源长度');
  }
  
  return [...source]
    .sort(() => Math.random() - 0.5) // 注意:这种排序不是真正的随机
    .slice(0, n);
}

使用示例

// 准备数据源
const dataSource = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10];
const n = 5;

// 方法一:Fisher-Yates(推荐)
console.log('方法一:', getRandomArray1(dataSource, n));
// 输出示例: [3, 7, 1, 9, 4]

// 方法二:Set 去重
console.log('方法二:', getRandomArray2(dataSource, n));
// 输出示例: [5, 2, 8, 1, 6]

// 方法三:标记法
console.log('方法三:', getRandomArray3(dataSource, n));
// 输出示例: [10, 3, 7, 2, 5]

// 方法四:splice 法
console.log('方法四:', getRandomArray4(dataSource, n));
// 输出示例: [4, 9, 1, 6, 3]

// 方法五:排序法
console.log('方法五:', getRandomArray5(dataSource, n));
// 输出示例: [2, 8, 4, 10, 1]

// 性能测试
const largeSource = Array.from({ length: 10000 }, (_, i) => i);
console.time('Fisher-Yates');
getRandomArray1(largeSource, 1000);
console.timeEnd('Fisher-Yates');

关键点

  • 方法一(Fisher-Yates)是最优解:时间复杂度 O(n),随机性好,适合所有场景

  • 时间复杂度对比

    • Fisher-Yates: O(n) - 最优
    • Set 去重法: O(n) ~ O(n²) - 当 n 接近数据源长度时性能下降
    • 标记法: O(n) - 但常数因子较大
    • splice 法: O(n²) - 不推荐
    • 排序法: O(m log m) - 对整个数据源排序,浪费性能
  • 空间复杂度考虑:所有方法都需要 O(n) 的额外空间存储结果

  • 随机性问题sort(() => Math.random() - 0.5) 不是真正的随机排序,存在偏差

  • 边界处理:需要判断 n 是否大于数据源长度,避免死循环

  • 实际应用建议

    • n 较小时:优先使用 Fisher-Yates
    • n 接近数据源长度时:Fisher-Yates 依然是最优选择
    • 不需要修改原数组:记得使用扩展运算符复制数组