当前位置: 首页 > news >正文

Rust多线程:Worker 结构体与线程池中任务的传递机制

本文分享自天翼云开发者社区《Rust多线程:Worker 结构体与线程池中任务的传递机制》,作者:l****n

Rust多线程:Worker 结构体与线程池中任务的传递机制

**在实现一个多线程的 Web 服务器时,我们会遇到一个问题:如何在创建线程之后让它们在没有任务时保持等待状态,并且在任务到来时可以立即执行。这是一个典型的线程池设计问题。在 Rust 中,我们需要通过自定义设计来实现这个功能,因为标准库中的 **thread::spawn 并不直接支持这种用法。

问题描述

**Rust 的 **thread::spawn 方法会立即执行传入的闭包。如果我们想要在线程池中创建线程并让它们等待任务(即在创建时不执行任何任务),我们就需要自己设计一种机制,能够在稍后将任务传递给这些已经创建好的线程。

解决方案:引入 Worker 结构体

**为了解决这个问题,我们引入了一个 **Worker 结构体来管理线程池中的每个线程。Worker 的作用类似于一个工人,它等待任务的到来并在接收到任务时执行。

1. Worker 结构体的定义

Worker 结构体包含两个字段:

  • id:用于标识每个 Worker
  • thread:存放线程的 JoinHandle<()>,它是由 thread::spawn 返回的。

代码如下:

struct Worker {id: usize,thread: thread::JoinHandle<()>,
}
2. 创建 Worker 实例

**为了让 **Worker 在没有任务时处于等待状态,我们可以在 Worker::new 函数中使用 thread::spawn 创建线程,并传入一个空的闭包:

impl Worker {fn new(id: usize) -> Worker {let thread = thread::spawn(|| {});
​Worker { id, thread }}
}

**在这里,我们创建了一个 **Worker 实例,每个 Worker 都会启动一个线程。但这个线程目前还什么都不做,因为我们传递给 spawn 的闭包是空的。

3. 将 Worker 集成到线程池中

**接下来,我们修改 **ThreadPool 的实现,使其存储 Worker 的实例而不是直接存储线程的 JoinHandle<()>。在 ThreadPool::new 中,我们使用一个 for 循环创建多个 Worker 实例,并将它们存储在一个 Vec<Worker> 中:

pub struct ThreadPool {workers: Vec<Worker>,
}
​
impl ThreadPool {pub fn new(size: usize) -> ThreadPool {assert!(size > 0);
​let mut workers = Vec::with_capacity(size);
​for id in 0..size {workers.push(Worker::new(id));}
​ThreadPool { workers }}
}

**这样,我们就为线程池创建了一个由多个 **Worker 组成的集合。每个 Worker 都有一个唯一的 ID,并且都启动了一个线程,虽然这些线程目前还没有执行任何有用的任务。

向 Worker 发送任务

现在,我们解决了创建线程并让它们等待任务的问题。接下来,我们需要设计一个机制,使得线程池能够在任务到来时将任务发送给等待中的线程。

1. 使用信道传递任务

**在 Rust 中,信道(channel)是一种非常适合在线程之间传递数据的工具。我们可以使用一个信道来传递任务。线程池会创建一个信道的发送端,每个 **Worker 会拥有信道的接收端。任务通过信道从线程池传递到 Worker,再由 Worker 中的线程执行。

use std::{sync::mpsc, thread};
​
pub struct ThreadPool {workers: Vec<Worker>,sender: mpsc::Sender<Job>,
}
​
struct Job;
​
impl ThreadPool {pub fn new(size: usize) -> ThreadPool {assert!(size > 0);
​let (sender, receiver) = mpsc::channel();
​let mut workers = Vec::with_capacity(size);
​for id in 0..size {workers.push(Worker::new(id));}
​ThreadPool { workers, sender }}
}
2. Worker 处理任务

**为了让 **Worker 能够处理任务,我们将信道的接收端传递给每个 Worker 的线程。线程会不断地从信道中接收任务,并执行这些任务。

impl Worker {fn new(id: usize, receiver: mpsc::Receiver<Job>) -> Worker {let thread = thread::spawn(move || {receiver;});
​Worker { id, thread }}
}

**不过在这段代码中,存在一个问题:信道的接收端 **receiver 被移交给了第一个 Worker,导致无法将其传递给其他 Worker

3. 使用 Arc 和 Mutex 共享接收端

**为了解决这个问题,我们需要使用 **Arc<Mutex<T>> 来共享信道的接收端,这样所有的 Worker 都可以安全地从同一个信道接收任务:

use std::{sync::{mpsc, Arc, Mutex}, thread};
​
type Job = Box<dyn FnOnce() + Send + 'static>;
​
impl ThreadPool {pub fn new(size: usize) -> ThreadPool {assert!(size > 0);
​let (sender, receiver) = mpsc::channel();let receiver = Arc::new(Mutex::new(receiver));
​let mut workers = Vec::with_capacity(size);
​for id in 0..size {workers.push(Worker::new(id, Arc::clone(&receiver)));}
​ThreadPool { workers, sender }}pub fn execute<F>(&self, f: F)whereF: FnOnce() + Send + 'static,{let job = Box::new(f);
​self.sender.send(job).unwrap();}
}
​
impl Worker {fn new(id: usize, receiver: Arc<Mutex<mpsc::Receiver<Job>>>) -> Worker {let thread = thread::spawn(move || loop {let job = receiver.lock().unwrap().recv().unwrap();
​println!("Worker {id} got a job; executing.");
​job();});
​Worker { id, thread }}
}

**在 **Worker::new 中,线程会不断地尝试获取锁来接收任务,并在收到任务后执行。这里我们使用了 Arc 来共享接收端,使用 Mutex 来确保一次只有一个 Worker 能够接收任务。

type Job = Box<dyn FnOnce() + Send + 'static>;

**这行代码定义了一个类型别名 **Job。它代表了一个特定的任务类型:

  • Box<dyn FnOnce() + Send + 'static> 是一个动态分发的闭包(或函数),其具体实现类型在编译时不确定。Box 是一个堆分配的智能指针,用于将闭包存储在堆上。
  • dyn FnOnce() 表示这个闭包实现了 FnOnce trait,可以被调用一次。
  • Send 表示这个闭包可以在线程之间安全地传递。
  • 'static 表示闭包的生命周期是整个程序的生命周期,确保闭包在多个线程中可以安全使用。
execute 方法

**这个方法的功能是将一个新的任务(闭包)添加到线程池的任务队列中,以供线程池中的工作线程执行。下面是对 **F: FnOnce() + Send + 'static 的解释:

  • F: FnOnce() + Send + 'static
    

    ** 是一个泛型约束,表示必须是一个实现了 FnOnce、Send和 'static的闭包类型。**

    • FnOnce() 确保闭包可以被调用一次。
    • Send 确保闭包可以安全地在线程之间传递。
    • 'static 确保闭包的生命周期足够长,可以在整个程序运行期间有效。

**在 **execute 方法中,你将传入的闭包 f 转换成 Job 类型(即 Box<dyn FnOnce() + Send + 'static>),然后通过 self.sender 将其发送到任务队列中。这使得线程池的工作线程可以从队列中接收并执行这些任务。

总结

**通过引入 **Worker 结构体并使用信道进行任务传递,我们成功地实现了一个可以延迟分配任务的线程池。每个 Worker 都是在创建时启动的,但它们会等待任务的到来,只有在接收到任务后才会开始执行。这种设计不仅提高了服务器的吞吐量,还确保了线程资源的高效利用。

http://www.zskr.cn/news/7533.html

相关文章:

  • 04-简单查询
  • MSS 到底是什么?Wireshark 分析TCP过程 - 教程
  • Manim实现闪光轨迹特效
  • 漏洞详解--文件上传 如何花样绕过?!
  • 深入解析:AI Agent开发秘籍:Prompt工程与测评最佳实践(建议收藏反复研读)
  • 实用指南:鸿蒙智能设备自动诊断实战:从传感器采集到远程上报的完整实现
  • 使用php -S 127.0.0.1:8000 新建php服务
  • WPF ControlTemplate DI Via Microsoft.Extensions.DependencyInjection
  • 完整教程:从“我店”模式看绿色积分电商平台的困境与破局
  • 完整教程:光伏电站安全 “守护神”:QB800 绝缘监测平台,为清洁能源高效运行筑固防线
  • Java的安装及卸载
  • 实用指南:订阅式红队专家服务:下一代网络安全评估新模式
  • Apache SeaTunnel 2.3.12 发布!核心引擎升级、连接器生态再扩张
  • StringComparer.OrdinalIgnoreCase
  • 在 WSL 中通过 Bash 函数快速转换 Windows 路径为 Ansible/WSL 路径 - 教程
  • 完整教程:如何管理好上网行为,8个上网行为管控措施分享,让上网井然有序
  • 金融租赁公司厂商租赁业务调研报告
  • 普科科技PKC7030H交直流电流探头应用指南​​
  • 从“分散”到“统一”,中控技术利用SeaTunnel构建高效数据采集框架,核心数据同步任务0故障运行!
  • T/B cell subtype marker - un
  • K8s Application模式下的flink任务执行精要
  • vim窗口垂直分屏和水平分屏对终端控制序列的微妙影响
  • 异常检测在网络安全中的应用 - 实践
  • python基础-推导式
  • IOT——维度追光框架
  • Scikit-learn 简单介绍入门和常用API汇总 - 教程
  • A公司一面:类加载的过程是怎么样的? 双亲委派的优点和缺点? 产生fullGC的情况有哪些? spring的动态代理有哪些?区别是什么? 如何排查CPU使用率过高?
  • 深入解析:大模型-Transformer原理与实战篇
  • Codeforces Round 1051 (Div. 2) D题启发(DP
  • Oracle清理:如何安全删除trace, alert和archivelog文件?