linux使用共享内存通信的进程同步退出问题

网络知识 2023-02-09 13:14www.1681989.comseo网站推广

两个甚至多个进程使用共享内存(shm)通信,总遇到同步问题。这里的“同步问题”不是说进程读写同步问题,这个用信号量就好了。这里的同步问题说的是同步退出问题,到底谁先退出,怎么知道对方退出了。举个例子进程负责读写数据库A,进程B负责处理数据。那么进程A得比进程B晚退出才行,因为要保存进程B处理完的数据。可是A不知道B什么时候退出啊。A、B是无关联的进程,也不知道对方的pid。它们唯一的关联就是读写同一块共享内存。正常情况下,进程B在共享内存中写个标识进程A你可以退出了,也是可以的。不过进程B可能是异常退出,连标识都来不及写。,共享内存用来做数据通信的,加这么个标识感觉不太好,有滥用的感觉。

  采用socket通信没有这个问题,因为进程B退出怎么也会导致socket断开,哪怕是超时。但shm却没有协议来检测这些行为,如果自己也做一个未免太麻烦。那就从共享内存下手吧。

  共享内存是由内核来管理的,一个进程删除本身打开的共享内存并不影响另一个进程的共享内存,哪怕都是同一块共享内存。这是因为共享内存在内核中一个引用计数,一个进程使用该共享内存就会导致引用计数加1。如果其中一个进程调用了删除函数,只有这个计数为0才会真正删除共享内存。那么,需要才退出的进程检测这个计数就可以了。

  在System V的共享内存中,创建一个共享内存会初始化一个结构


复制代码

代码如下:

struct shmid_ds {
struct ipc_perm shm_perm; / Ownership and permissions /
size_t shm_segsz; / Size of segment (bytes) /
time_t shm_atime; / Last attach time /
time_t shm_dtime; / Last detach time /
time_t shm_ctime; / Last change time /
pid_t shm_cpid; / PID of creator /
pid_t shm_lpid; / PID of last shmat(2)/shmdt(2) /
shmatt_t shm_nattch; / No. of current attaches /
...
};

使用shmctl函数可以读取该结构体,其中的shm_nattch就是使用该共享内存的进程数。

  不过,现在有了新的POSIX标准,要用新标准了。shm_open创建的共享内存也具有“一个进程删除本身打开的共享内存并不影响另一个进程的共享内存”的特点。可是用shm_open创建的共享内存不再有上面的结构,那么,内核是怎么管理shm_open创建共享内存??看下面的源码


复制代码

代码如下:

/ shm_open - open a shared memory file /</p> <p>/ Copyright 2002, Red Hat Inc. /</p> <p>#clude <sys/types.h>
#clude <sys/mman.h>
#clude <unistd.h>
#clude <strg.h>
#clude <ftl.h>
#clude <limits.h></p> <p>t
shm_open (const char name, t oflag, mode_t mode)
{
t fd;
char shm_name[PATH_MAX+20] = "/dev/shm/";</p> <p> / skip openg slash /
if (name == '/')
++name;</p> <p> / create special shared memory file name and leave enough space to
cause a path/name error if name is too long /
strlcpy (shm_name + 9, name, PATH_MAX + 10);</p> <p> fd = open (shm_name, oflag, mode);</p> <p> if (fd != -1)
{
/ once open we must add FD_CLOEXEC flag to file descriptor /
t flags = ftl (fd, F_GETFD, 0);</p> <p> if (flags >= 0)
{
flags |= FD_CLOEXEC;
flags = ftl (fd, F_SETFD, flags);
}</p> <p> / on failure, just close file and give up /
if (flags == -1)
{
close (fd);
fd = -1;
}
}</p> <p> return fd;
}

我嚓,这就是创建一个普通的文件啊,只是创建的位置在/dev/shm下(也就是RAM上)。再来看看删除共享内存的函数shm_unlk


复制代码代码如下:
/ shm_unlk - remove a shared memory file /</p> <p>/ Copyright 2002, Red Hat Inc. /</p> <p>#clude <sys/types.h>
#clude <sys/mman.h>
#clude <unistd.h>
#clude <strg.h>
#clude <limits.h></p> <p>t
shm_unlk (const char name)
{
t rc;
char shm_name[PATH_MAX+20] = "/dev/shm/";</p> <p> / skip openg slash /
if (name == '/')
++name;</p> <p> / create special shared memory file name and leave enough space to
cause a path/name error if name is too long /
strlcpy (shm_name + 9, name, PATH_MAX + 10);</p> <p> rc = unlk (shm_name);</p> <p> return rc;
}

这也只是一个普通的unlk函数。也就是说,POSIX标准的共享内存就是一个文件。所谓的“一个进程删除本身打开的共享内存并不影响另一个进程的共享内存”就相当于你用fstream对象打开了一个文件,然后去文件夹把文件删除了(也就是对文件进行了unlk操作),可是fstream对象还可以正常读写文件,并没有什么引用计数。这下好了,进程退出时又没法同步了。

  不过,在lux下怎么会有解决不了的问题呢?解决不了只能说明自己太菜。既然是文件,那就从文件下手。那文件有什么是原子操作,又可以计数的呢。答案硬链接。比如


复制代码代码如下:
xzc@xzc-HP-ProBook-4446s:/dev/shm$ stat abc
文件"abc"
大小4 块8 IO 块4096 普通文件
设备15h/21d Inode5743159 硬链接1
权限(0664/-rw-rw-r--) Uid( 1000/ xzc) Gid( 1000/ xzc)
最近访问2015-01-25 21:27:00.961053098 +0800
最近更改2015-01-25 21:27:00.961053098 +0800
最近改动2015-01-25 21:27:00.961053098 +0800
创建时间-
xzc@xzc-HP-ProBook-4446s:/dev/shm$

这个硬链接可以通过fstat函数获取。可是要这样实现的话,意味着需要先创建一块共享内存,每个进程引用的时候需要调用lk函数来创建一个硬链接。问题解决了,可是这样会在/dev/shm下多个N多个文件。这可是RAM啊,虽然现在的服务器都比较牛,但这样做也不太好吧。好吧,还有一个flock文件锁。flock使用LOCK_SH参数多个进程对同一个文件加锁。这样,进程B初始化共享内存时加锁(可以有多个这样的进程),在退出(包括异常退出)时解锁。进程A在退出时检测这个锁。当发现无锁时说明可以安全退出了。

  同步退出的问题基本解决了。来不及写代码去验证,下次吧。

PS内核unlk时应该也是有计数才知道当前有没有进程打开文件,在什么时候应该删除文件。这个还得去查资料,看用不用得上。lsof这个工具是可以检测到所有打开该共享内存的进程及相应的状态。这个应该也是有对应的api的,只是现在还没搞懂。

上一篇:fcntl函数的说明与实例 (文件加锁) 下一篇:在CentOS/RHEL中安装基于Web的监控系统 linux-dash

Copyright © 2016-2025 www.1681989.com 推火网 版权所有 Power by