一种异常文件访问行为监控方法和装置与流程

文档序号:20165586发布日期:2020-03-24 21:27阅读:165来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
一种异常文件访问行为监控方法和装置与流程

本发明涉及日志大数据领域,尤其涉及一种异常文件访问行为监控方法和装置。



背景技术:

在操作系统运行过程中,用户的每次操作都会留下痕迹,这就是日志,每个日志文件由日志记录组成,其中每条日志记录对应一个单独发生的事件。日志系统是操作系统中一个非常重要的组成部分。它可以记录下用户产生的所有行为并按照规范格式表达出来。这种记录下来的信息,对于系统状态监控、系统安全审计和用户行为监控有着十分重要的意义。

现有的基于日志的安全审计方法多是建立在日志记录完整的前提下,对多粒度的异常行为进行识别,具有极大的局限性,无法在攻击者实施攻击后删除或修改日志文件擦出攻击痕迹的情况下有效识别出攻击行为。因此,如何对文件系统进行监控,识别出非法删除修改行为是目前日志安全审计研究必须考虑的一个问题。

在生产环境中,通常服务器集群的正常使用者会有一定的群组性特征,同一群组内的使用者具有相似业务背景,即具有相似访问行为。



技术实现要素:

根据上述研究背景和问题,本发明提供了一种异常文件访问行为监控方法和装置,用于对服务器集群进行安全审计,过滤正常用户对文件的访问行为,准确识别出用户对文件的异常访问行为。

一种异常文件访问行为监控方法具体步骤如下:

步骤1、配置监控日志

配置实时的记录用户操作命令及部分用户属性信息的日志记录,所记录的用户属性信息可自定义,范围包括但不限于:用户名,用户远端ip,操作发生时间,操作发生目录,操作目标文件,操作命令。

步骤2、采集系统历史日志

采集的系统日志包括但不限于:定制的监控文件访问行为的日志和定制的记录用户操作命令的日志。

步骤3、计算用户相似度

提取每个用户对不同文件的访问行为,定义用户的向量表示:n维向量,其中n为所有文件的总数,若用户访问过该文件,则相应位置置为1,反之,置为0。

步骤4、获取用户访问权限优先级排序

基于步骤3得到的相似度矩阵,以相似度为权重加权计算所有邻居用户对所有文件的访问系数并累加,作为当前用户文件访问权限优先级排序。其中访问系数定义如下:若用户访问过该文件,则系数为1,反之,系数为0。

步骤5、提取用户访问权限白名单

考虑到该名单应包含所有用户在历史数据中显式访问过的文件,该名单不应毫无根据的或一概而论的扩充所有用户的访问权限。基于上述事实情况,在生成白名单时,从用户文件访问权限优先级排序中选取包含历史数据中当前用户显式访问的所有日志文件的最小topn集合,作为该用户的访问权限列表,即该用户访问权限白名单。

步骤6、实时监控系统日志

基于sparkstreaming流处理框架接收流式日志数据,通过spark的微批处理机制实现对系统日志的实时监控。

步骤7、多源日志关联识别文件访问行为。

通过多系统日志关联分析,识别流式日志数据中包含的文件访问行为,具体过程:基于流式数据,关联记录用户操作的日志和定制的监控日志,对于每条从监控日志中得到的记录,在记录用户操作的日志中查找满足以下条件的记录:监控日志中记录的时间戳比该条记录用户操作的日志中的记录的时间大,但是不超过一个很短的时间,这一时间阈值可根据系统实际情况自行调整并给出默认推荐值。可以认为在这一时间范围内的记录用户操作的日志中的日志记录可能存在与该条监控日志记录对应同一操作行为的记录。对比监控日志与记录用户操作的日志中记录的操作执行目录、操作命令与操作目标日志等信息,找到与监控日志记录相应的记录用户操作的日志中的记录。从上述两种日志中识别用户进行的文件删改操作。

步骤8、白名单过滤

将上述文件访问行为基于上述白名单进行过滤,过滤掉用户对权限内的文件进行访问的访问行为,得到最终异常文件访问行为。

步骤9、提取输出结果信息并输出

从最终异常文件访问行为日志中提取多维度输出信息,包括但不限于用户名、登录时的远端ip、操作命令、操作执行目录、操作目标文件及是否成功删除或修改等信息,最终输出或持久化到包括但不限于消息队列,数据库,文件系统或分布式文件系统。

与现有技术相比,本发明的有益效果是:

1)可监控更加广泛的文件系统。

2)通过生成白名单,过滤正常访问行为,减少误报率。

3)基于流处理框架进行实时检测。

附图说明

图1是本发明异常文件访问行为监控的流程图。

图2是本发明异常文件访问行为装置的原理图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明一种异常文件访问行为监控方法,包括:

步骤1、配置监控日志

配置实时的记录用户操作命令及部分用户属性信息的日志记录,所记录的用户属性信息可自定义,范围包括但不限于:用户名,用户远端ip,操作发生时间,操作发生目录,操作目标文件,操作命令。

步骤2、采集系统历史日志

采集的系统日志包括但不限于:定制的监控文件访问行为的日志和定制的记录用户操作命令的日志,分别发送历史日志数据到数据库系统(hadoopdatabase,hbase)、发送实时日志数据到分布式发布订阅消息系统(kafka)。

步骤3、计算用户相似度

从数据库系统(hadoopdatabase,hbase)获取历史日志数据提取每个用户对不同文件的访问行为,定义用户的向量表示:n维向量,其中n为所有文件的总数,若用户访问过该文件,则相应位置置为1,反之,置为0。计算所有用户两两之间的相似度,并生成相似度矩阵。距离度量根据需要可选择欧包括但不限于几里德距离、皮尔逊相关系数或cosine相似度,计算原则:

欧几里德距离(euclideandistance)

当用欧几里德距离表示相似度,一般采用以下公式进行转换:距离越小,相似度越大。

皮尔逊相关系数(pearsoncorrelationcoefficient)

其中n为向量的维度,sx,sy是x和y的样品标准偏差。

cosine相似度(cosinesimilarity)

其中x、y是两个不同用户的向量表示,xi和yi表示两个用户向量的第i维取值。

步骤4、获取用户访问权限优先级排序

基于步骤3得到的相似度矩阵,以相似度为权重加权计算所有邻居用户对所有文件的访问系数并累加,作为当前用户文件访问权限优先级排序。其中访问系数定义如下:若用户访问过该文件,则系数为1,反之,系数为0。

步骤5、提取用户访问权限白名单

考虑到该名单应包含所有用户在历史数据中显式访问过的文件,该名单不应毫无根据的或一概而论的扩充所有用户的访问权限。基于上述事实情况,在生成白名单时,从用户文件访问权限优先级排序中选取包含历史数据中当前用户显式访问的所有日志文件的最小topn集合,作为该用户的访问权限列表,即该用户访问权限白名单。

步骤6、实时监控系统日志

从分布式发布订阅消息系统(kafka)中实时消费日志数据,并转换为sparkstreaming数据流,基于sparkstreaming流处理框架接收流式日志数据,通过spark的微批处理机制实现对系统日志的实时监控。

步骤7、多源日志关联识别文件访问行为。

通过多系统日志关联分析,识别流式日志数据中包含的文件访问行为,具体过程:基于流式数据,关联记录用户操作的日志和定制的监控日志,对于每条从监控日志中得到的记录,在记录用户操作的日志中查找满足以下条件的记录:监控日志中记录的时间戳比该条记录用户操作的日志中的记录的时间大,但是不超过一个很短的时间,这一时间阈值可根据系统实际情况自行调整并给出默认推荐值。可以认为在这一时间范围内的记录用户操作的日志中的日志记录可能存在与该条监控日志记录对应同一操作行为的记录。对比监控日志与记录用户操作的日志中记录的操作执行目录、操作命令与操作目标日志等信息,找到与监控日志记录相应的记录用户操作的日志中的记录。从上述两种日志中识别用户进行的文件删改操作。

步骤8、白名单过滤

将上述文件访问行为基于上述白名单进行过滤,过滤掉用户对权限内的文件进行访问的访问行为,得到最终异常文件访问行为。

步骤9、提取输出结果信息并输出

从最终异常文件访问行为日志中提取多维度输出信息,包括但不限于用户名、登录时的远端ip、操作命令、操作执行目录、操作目标文件及是否成功删除或修改等信息,最终输出或持久化到包括但不限于从分布式发布订阅消息系统(kafka),数据库(postgresql),文件系统或分布式文件系统(hadoopdatabasefilesystem,hdfs)。

相应地,本发明提供了一种异常文件访问行为监控装置,如图1所示,包括:

日志采集单元101、离线训练单元102及行为监控单元103;

日志采集单元101,包括:分布式文件系统(hadoopdistributedfilesystem,hdfs)、数据库系统(hadoopdatabase,hbase)及分布式发布订阅消息系统(kafka),分别向离线训练单元102和行为监控单元103提供数据接口,分别发送历史日志数据到数据库系统(hadoopdatabase,hbase)、发送实施日志数据到分布式发布订阅消息系统(kafka);

离线训练单元102,从日志采集单元101提供的数据接口数据库系统(hadoopdatabase,hbase)获取历史日志数据1011,基于spark大数据平台,依次完成如下步骤:提取用户访问文件列表1021、计算用户邻居节点列表1022、计算用户访问权限列表1023、生成用户访问文件白名单1024;

生成用户访问文件白名单1024输出用户访问文件白名单到数据库(postgresql);

行为监控单元103,从日志采集单元101提供的数据接口分布式发布订阅消息系统(kafka)中实时消费日志数据1012,并转换为sparkstreaming数据流,基于sparkstreaming流处理框架,依次进行多日志关联分析1031、识别所有文件删改行为1032、识别非法文件删改行为1033;

识别非法文件删改行为1033从数据库(postgresql)读取生成用户访问文件白名单1024步骤生成的用户访问文件白名单。

综上,本发明包括了基于相似度的用户访问权限白名单补全研究和基于多源日志关联的文件访问行为识别研究,其中:

基于相似度的用户访问权限白名单补全研究,是从历史数据提取每个用户对不同文件的访问次数,作为该用户的向量表示,计算所有用户两两之间的相似度,计算原则包括但不限于欧几里得距离、皮尔逊相关系数等,生成相似度矩阵。基于用户相似度,计算所有用户的邻居用户,并根据邻居用户相似度为权重加权计算获得当前用户对所有文件的访问权限,获取用户访问权限优先级排序。考虑到该名单应包含所有用户在历史数据中显式访问过的文件,该名单不应毫无根据的或一概而论的扩充所有用户的访问权限。基于上述事实情况,在生成白名单时,从选取包含历史数据中当前用户显式访问的所有日志文件的最小topn集合,作为该用户的访问权限列表,即该用户访问权限白名单。

基于多源日志关联的文件访问行为识别研究,则是基于流式数据,关联记录用户操作的日志和定制的监控日志,对于每条从监控日志中得到的记录,在记录用户操作的日志中查找满足以下条件的记录:监控日志中记录的时间戳比该条记录用户操作的日志中的记录的时间大,但是不超过一个很短的时间,这一时间阈值可根据系统实际情况自行调整并给出默认推荐值。可以认为在这一时间范围内的记录用户操作的日志中的记录记录可能存在与该条监控日志记录描述同一操作行为的记录。对比监控日志与记录用户操作的日志中记录的操作执行目录、操作命令与操作目标日志等信息,找到与监控日志记录相应的记录用户操作的日志中的记录。从上述两种日志中识别用户进行的日志删改操作,并提取多维度信息并输出。

本发明的异常日志访问行为识别,支持用户自定义的配置监控策略,实现对目标日志或目录的访问行为监控,通过多源日志融合,从流式数据中识别出异常日志访问行为,并提取出包括但不限于操作用户名,登录时的远端ip,操作命令,操作执行目录,操作目标文件及是否删除或修改成功等多维度信息。同时,采用基于用户的协同过滤算法,从历史数据中挖掘学习用户访问日志文件权限白名单,极大的减少了检测过程中的误报率,提供更加精确的识别结果。

完整全部详细技术资料下载
当前第1页 1  2  3 
相关技术
  • 一种存储集群的权限确定方法、...
  • 自动化检测方法、装置、存储介...
  • 一种信息显示方法、电子设备及...
  • 一种付费用户管理方法、装置、...
  • 一种保留分布特征的地址脱敏方...
  • 用于车辆的个人信息保护设备、...
  • 一种访问控制方法、设备、系统...
  • 数据处理方法、装置、设备和介...
  • 一种数据加密方法、电子设备及...
  • 客户数据获取方法、装置及可读...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1

代做工资流水公司武汉离职证明代做遵义打转账银行流水沈阳个人工资流水 制作镇江打印车贷流水福州代办薪资流水淮安做工资代付流水扬州办签证流水湖州车贷工资流水 图片湖州银行流水账单费用泉州制作对公账户流水滁州打贷款工资流水蚌埠办日常消费流水滁州办理薪资流水单桂林工资证明开具温州企业贷流水费用厦门流水打印开封入职流水费用大连个人工资流水 代做常德做收入证明济宁查询银行流水单湛江工资流水账单模板长沙做房贷银行流水泰州代开工资流水账单合肥银行流水样本桂林代办入职工资流水海口代办背调工资流水成都打印企业流水打印上海入职流水打印商丘工资银行流水价格衡阳办企业贷流水香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

代做工资流水公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化