来自 数据 2021-06-10 13:16 的文章

ddos防御_云盾科技_怎么办

ddos防御_云盾科技_怎么办

将此共享按钮添加到FaceBookShare到TwitterTwitterShare到LinkedInLinkedInShare到电子邮件2017年11月7日出版作者:Securonix实验室介绍数据科学是一个跨多个技术学科的领域,安全狗防御不了ddos,包括计算机科学、统计学和应用数学。数据科学的目标是用科学的方法从数据中提取有价值的信息。大规模数据存储和分布式计算的发展使我们能够处理由网络和互联网活动产生的众所周知的大量数据。高性能计算资源的可用性和可负担性使数据科学家能够开发复杂的模型,分析曾经势不可挡的大型数据集。统计学和机器学习是数据科学所采用的两种关键技术,它们有着共同的目标:从数据中学习。虽然它们之间的差异由于彼此之间的大量借用而变得不那么明显,但是了解所使用的方法和每种方法的适用性对于了解它们为数据科学带来的所有能力是很重要的。统计统计学是指从数据中作出推论。这通常涉及到试图理解创建数据的底层机制,静态能防御cc吗,并应用适当的技术来建模过程。为了做到这一点,我们对数据进行了假设,以建立一个可处理的模型并获得见解。当任务涉及到理解数据中的结构以获得结果时,统计模型通常擅长于识别潜在模式,并通过其概率框架解释其不确定性。这通常需要少量的特征和大量的数据,以确保所需的估计是稳健的,以便从模型中获得有用的信息。例如,高防cdn空间,在分析每日事务量时,安全分析员可能会对识别特定日期的异常值感兴趣,这些异常值可能表示恶意活动。他们可以使用统计推理来查看交易量的日平均值,并调用中心极限定理来证明平均值是正态分布的假设。一旦正态分布适合数据,它的估计参数(均值和方差)就可以用来定义一系列被认为是正态活动的值。那些超出这个范围的金额被认为是可疑的,因为它们是不可能的,并由安全分析师进一步调查。蓝线是拟合的正态分布。异常值落在箭头所示的范围内;当观察到这些异常值时,这些值会被标记出来,并发送给分析员进行进一步检查。异常事件的检测超出了日均交易等数字信息。特别是,要对非数字或分类数据的罕见事件进行估计和评分,我们需要了解底层数据生成过程以正确建模,或者使用其他统计方法来量化和缩放分类变量。在下面的例子中,多重对应分析(MCA)被用来将分类变量转换成由主要主成分定义的空间中的坐标(只显示了两个维度)。然后在同一空间内进行聚类分析,将具有相似类别的个体分组并识别异常值。类别(左)和个体(右)在多重对应分析(MCA)的两个主要成分上的投影。统计学的目的是推断输入和输出之间的关系,并成功地解释了当所有的随机化和概率分布的假设被满足时的基本过程。然而,现实生活中的许多过程虽然复杂,却远不是随机的,建立一个随机样本的实验往往是不可行的。在这种情况下,统计模型可能仍然具有较高的解释力,但预测能力较低,因为它遵循无效的假设,因此可能会产生误导。现代数据集是丰富的、多样的和高维的,数据来自多个来源,每一个都代表着一个复杂的过程。在这里拟合正确的分布需要估计大量的参数,并且存在忽略有价值的信息、无法识别数据的重要特征或捕获错误信息而得出可疑结论的风险。当特征的数量明显超过观察的数量时,推断也很困难。对于此类问题,准确的统计模型可能过于繁琐,难以构建,并且需要频繁甚至接近实时的更新来反映不断变化的威胁环境,这在计算上可能会非常昂贵。机器学习传统意义上的统计学关注的是推理,依赖于对数据的一系列假设,而机器学习(ML)假设很少,不需要明确编程就可以从数据中学习,并且强调预测而不是直接对数据建模。ML根据经验发现数据中的关系,关注重要特征而忽略噪声特征,并且只需从数据中提取对预测有用的特征。通过将数据生成过程视为一个黑匣子,并且只关注预测能力,ML的主要好处是它能够获得结果,而无需对数据进行明确的假设。特别是,在处理高维数据时,包含在其中的信息可以在算法模型中编码,而不必单独理解每个特征。由于识别数据中的结构不是重点,计算机科学家看重具有良好可伸缩性和效率的算法。例如,当分析人员分析安全事件案例的处理时,可以构建ML分类器来对分析人员的选择进行建模。然后,该分类器可用于预测未来案例的可能结果,增强分析员审查案例的能力,从而缩短分类时间,并允许分析员更好地安排工作优先级。分析者的思维过程过于复杂,无法直接建模,但通过只关注预测的质量,组建高防cdn,分类器可以避免这一困难,并合理地再现分析师的选择。单个决策树(左)和随机森林集合(右)的示例。决策树是一种简单直观的算法,可以产生易于解释的结果,如何防御ddos么,但它无法在这样复杂的数据中捕捉复杂的关系,因此预测性能较差。随机森林是决策树的集合,是一种强大的分类和回归算法,一般具有抗过拟合(建模噪声)和较强的预测能力。它不仅可以管理分析员决策过程的复杂性,而且还可以捕获不同分析员处理案例的不同决策路径。这种能力和灵活性是有代价的:通过使用黑盒方法进行预测,我们牺牲了结果的可解释性。需要额外的统计设施来进行这种解释。DARPA的挑战"可解释的人工智能"(https://www.darpa.mil/attachments/darpa-BAA-16-53.pdf)清楚地说明了对可解释的ML模型的需要以及开发有效解释技术的困难。我们的方法我们数据科学方法的核心是统计机器学习,它是应用统计学和大规模机器学习技术的有力结合,旨在发现数据中的复杂模式并预测未来结果。统计机器学习中特定方法的选择取决于数据类型和要解决的问题,重点是自动化分析和最少的人工干预。应用于安全分析,这种方法使我们能够在最短的时间内以最少的错误检测到高级和复杂的网络威胁。本系列的其他章节:导言-数据科学:全面审视Ch 1–SIEM 2.0:为什么需要安全分析? 第2章-数据科学:统计与机器学习第3章-无监督学习:安全与数据科学的结合第4章-监督学习:捕捉分析师的思维过程第5章-特色工程:科学还是艺术?