每一章后面的要点,对照“要点”回顾内容

1~3章 图论 联系

  • 三元闭包理论:如果两人在社会网络中有一个共同的朋友,则他们俩将来成为朋友的可能性提高。

    两个人的共同朋友越多,则他们成为朋友的可能性越高

    两个人与共同朋友的关系越密切,则他们成为朋友的可能性越高

  • 三元闭包的衡量标准——节点的聚集系数:A的任意两个朋友之间也是朋友的概率

    聚集系数计算方法

  • 强三元闭包原理(假设)

    如果A-B和A-C之间的关系为强关系;则B-C 之间形成边的可能性应该很高;

  • 桥、捷径的定义

    捷径:

    若边A-B的端点A和B没有共同的朋友,则称边A-B为捷径

    若删除该边,A和B的距离增加至2以上,则该边为捷径

    捷径的跨度为改变两端点在没有该边情况下的实际距离

    一个图中,已知A和B相连,若去掉连接A和B的边会导致A和B分属不同的连通分量,则将该边称为

  • 证明:(反证法)在社交网络中,若节点A满足强三元闭包性质,并至少两个强联系边与之相连,则与其相连的任何捷径均为弱联系

  • 边(A,B)的邻里重叠度

    捷径 = 邻里重叠度为0的边

  • 结构洞

  • 划分图:

    一种是根据介数的划分方法:Newman方法,

    • 介数:

    • 通过每次删去图中介数最大的边,来实现对图的划分,介数最大的边,即为最关键的边。许多节点之间的的最短路径都要经过他

    • 介数计算的一种方法:

      • 从一个节点(A)开始,做宽度优先搜索,将节点分层(以便于下面的步骤)
      • 确定从A到其他每个节点的最短路径的条数
      • 确定当从节点A沿最短路径向其他所有节点发送1个单位流量时,经过每条边的流量。

      对每一个节点,重复上述过程,累计,除以2,即得每条边的介数。

      例子

      每个点除了下面的点还给他的值之外,还有A发送的一个单位的信息流

      image-20220428165411668

4章 同质性

  • 同质性:

    定义:我们和自己的朋友间往往会有相同的特点,即社交网路中互相连接的人倾向于相似

    量化标准:

    image-20220424195815788 image-20220424200036121 在这里插入图片描述
  • 三种闭包:三元闭包、会员闭包、社团闭包

    image-20220424200700693
    • 例子:

      image-20220424200842125

      A加入W可能性更高,因为有两个好友D,E都在W

  • 朋友间相似的原因:选择(selection),影响(influence)

    image-20220424201141837

    如下图:选择对应社团闭包,影响对应会员闭包

    img
  • 隔离:同质化影响下发生的过程

    谢林模型:隔离的一种空间模型

    同质性影响结果:固有特质相同->可变特质趋同

5章 结构平衡 正负关系

  • 边的正负性

    在这里插入图片描述

    只有++++--两种关系是稳定的

  • 社会网络的结构平衡:(完全)图的结构是平衡的,若其中所有三角关系都是平衡的(即每个三角关系要么3+,要么1+和2-)。

    • 平衡定理

      如果一个标记的完全图是平衡的,则要么它的所有节点两两都是朋友,要么它的节点可以被分为两个组X和Y,其中X组内的节点两两都是朋友,Y组内的节点两两也是朋友,而X组中的每个节点都是Y组中每个节点的敌人

  • 非完全网络(允许一些边的缺失)中的结构平衡;

    • 可以通过补充缺失的边(带符号),成一个平衡网络(这和完全图的平衡定义一致)
    • 节点可以分成两组(组内边为+,跨组为-)
      这和平衡定理中给出的宏观结论一致(两个阵营)

    两个定义是等价的:

    image-20220424210542669
  • 网络是否平衡的一个判断方法:一个标注图是平衡的,当且仅当它不包含有奇数个负关系的边的圈

  • 将每个联通子图抽象为超结点,超结点之间以-连接

    image-20220424212219952 image-20220424212235274 image-20220424212249070

    图中存在奇数长度圈,当且仅当广度优先搜索结果中存在同层的边

6章 博弈

博弈三要素:参与人,策略(概率),收益

  • 几种经典的模型:考试-报告博弈,囚徒困境,兴奋剂博弈,营销博弈

  • 最佳应对-占优策略(严格/不严格):

    在这里插入图片描述

    占优策略的概念是相对于对方所有策略而言的,而最佳应对是针对单个策略而言。

  • image-20220424222649092
  • 无占优策略例子(三客户博弈)

    引出纳什均衡两个策略互为最佳应对

    image-20220424221136600
  • 多重均衡(存在多组纳什均衡)-协调博弈

    例子:PPT制作(对等)

    image-20220424221430369
    • 不对等协调博弈:

      image-20220424221501645
    • 两人喜好不同时:

      image-20220424221520952
  • 猎鹿博弈:

    image-20220424221814427

    要在高收益和由于另一方不合作而造成损失之间进行权衡。

  • 鹰鸽博弈:

    image-20220424222543825
  • 一般来说,纳什均衡的概念能有助于缩小预测范围,但它不一定能给出唯一的预测

  • image-20220424222732113
  • 硬币博弈—零和博弈(不存在纳什均衡)

    image-20220424222842762 image-20220424222924861
  • 混合策略,引入概率

    image-20220425103705527

    混合策略互为最佳应对的必要条件

    image-20220425104052496 image-20220425104106939

    再来一个混合策略均衡的例子:持球抛球博弈:

    image-20220425104251004 image-20220425104326659

    讨论:

    image-20220425104442018

    【兼具纯策略和混合策略均衡的博弈】

    好的概率策略是使对方不知道用那个纯策略更好的策略

    image-20220425105157909
    • 没有混合策略均衡的纯策略博弈:

      image-20220425105328811
  • 双人双策略博弈均衡的一般求法

    image-20220425105412617
  • 一组策略选择是社会最优的(或社会福利最大化),若它使参与者的回报之和(总收益)最大。

    image-20220425105450712

    社会最优和纳什均衡有可能一致,此时是理想系统

7章 进化博弈论

这章不太懂

对博弈论的推广——进化博弈论

  • 囚徒困境:

    • 均衡出现在双方采用某一种相同的策略

    • 对应社会最优的策略组不是均衡,因为参与人之一有动机改变策略

  • 鹰鸽博弈:

    • 均衡出现在双方采用不同的策略
image-20220425165059972
  • 进化稳定策略考察例子:

    还是引入概率,计算期望

    • 大体型:

      image-20220425165353510
    • 小体型:

      image-20220425165517931
  • 生物学家认为在自然界中存在具有囚徒困境结构的进化博弈现象

    例如病毒之间的进化博弈,类似囚徒困境

    image-20220425165630758
  • 进化博弈论小结:

    image-20220425165720107

8章 网络流量博弈论

  • 均衡的流量,布雷斯悖论

  • 根据潜能的概念,借助动态规划

    image-20220425183651673
  • 要点:

    image-20220425183543836

9章 拍卖博弈论

  • 四种拍卖:英式拍卖(买家从低到高报价),荷兰式拍卖(卖家从高到低出价)

    次价密封拍卖,首价密封拍卖

  • 在次价密封拍卖中,按照自己的估值出价最优

    一个按照自己估值出价的人不可能通过改变策略得到更大的回报,无论别人出价策略如何。

    因此,我们可以说:“次价支付规则”鼓励真实报价

  • 而首价封闭拍卖中,没有这种性质

10章 匹配市场

  • 匹配市场基本模型:二部图

  • 匹配市场操作的一般过程:卖方根据买家的需求调整自己的价格

    出价-涨价-出价-涨价…直到买卖双方都满足

    步骤:

    image-20220425193834070
  • 受限组的定义:首先,取二部图右边任何一组节点S,将左边通过边与其相连的节点称为S的邻居,用N(S)表示所有S邻居的集合,如果S比N(S)的数量大,即S比N(S)包含更多的节点,那么右边的S就受到限制

    买方受限组:即在组中,买方的个数多于卖方的个数,需求大于供给

    买方受限组是从买方连到卖方的

  • 一定能按照上述步骤得出一个结果

    最终卖方的结果不唯一,但一定是社会最优

11章 中间商市场

  • 垄断和竞争:

    image-20220425204151861
  • 社会福利及其最优问题:

    image-20220425204946633

12章 社交关系价值的均衡

  • 定义“结果”:

    image-20220425212201436
  • 稳定结果:

    image-20220425210254768
  • 平衡结果:

    不稳定因素:不在结果中的一条边,其两端节点的价值之和小于1

    纳什议价解

    image-20220425210929309 image-20220425210940530

  • 外部选项:放弃当前的匹配关系后所能得到的最大好处,即退路的价值

    image-20220425211913707
  • 平衡结果:(判断结果是否平衡的步骤:求出外部选项->计算结果中每条边的交换是否平衡

    image-20220425211957604
  • 三个概念的包含关系:【结果【稳定结果【平衡结果】】】

13章 万维网信息的结构

  • Web信息结构的模型:

    image-20220425221357324
  • Web信息结构的概貌:

    image-20220425222253141
  • 给定一个节点,如何确定包含它的强连通分量?

    广度优先搜索(?)

14章 网络信息的链接信息

  • 当向搜索引擎中查询一个词时,是什么决定了网页的排名?

    一个网页的链入数越多,排名应该越靠前

    有效利用链接关系蕴含的信息,是搜索引擎超越传统信息检索系统、技术进步的最重要标志

  • 网页的中枢性,与权威性

    image-20220426140043764

    HITS算法:

    权威更新规则:对于每个网页p,以所有指向该网页的网页中枢值之和更新这个网页的权威值

    中枢更新规则:对于每个网页p,以所有该网页指向的网页权威值之和更新这个网页的中枢值

    image-20220426141440270

    一个HITS算法的例子

    先更新权威值,再更新中枢值:

    image-20220429230121526
  • 通过PageRank计算网页的重要性:

    image-20220426140425592 image-20220426140225081

    迭代的例子:

    image-20220426140908587

    为了避免一些自私的节点只吸收别人的价值,不向外传递,即只被指向,不指向别人,无限次迭代之后

    image-20220426140603484
    • 引入同比缩减与统一补偿原则:

      image-20220426140638144
  • 随机游走:PageRank的另一种等价理解:

    image-20220426141013413

15章 搜索引擎中的广告市场

  • 一些概念:

    image-20220426183025669

    根据点击率和点击收入可以计算出估值,再结合匹配市场中的方法

    image-20220426183611263 image-20220426184030015

    采用拍卖的方式,GSP:单品次价拍卖机制的一种“自然”推广

    image-20220426184218709

    在多个商品同时拍卖的情形,如此推广的一种次价拍卖规则(GSP)没有单品次价拍卖(鼓励真实报价)的优良性质

  • 改进:

    image-20220426190108540

    一个例子

    image-20220426190321069 image-20220426190415762

    • 执行步骤

      image-20220426190759340
  • VCG价格机制的优良特性:

    鼓励“讲真话”:按照真实估值出价是每个竞拍者的占优策略

    即没有理由故意让出价偏离估值(无论别人如何出价)

    换言之,大家都按照估值报价是一个纳什均衡

    社会最优:买方估值总和最大

    按照机制执行的定义,当大家都“讲真话”时,所得到的广告位分配就是估值总和最大的

  • 但实际中,VCG不好懂,GSP用的更多

18章 幂律与富者更富

  • 幂律:流行度的一种主导规律

    图形表示:

    image-20220426195208286

    幂律的基本特性:

    • 不受观察尺度影响
    • 平均不等于典型
    image-20220426195254994

    Scale free,意味着从任何一个比例尺度(数据)上看到的函数特征都一样

  • “长尾”有利于经营利基产品:除了top-K外,利基产品的总市场占有率随max增加,K是固定的。

    二八定律:“销量排前20%的书的销量之和占总销量的80%”,max增加,比例不变。

20章 小世界现象

  • 社会网络中两节点间包含丰富的短路径

    通过“有意识的转发”能够“自动地”找到这些短路径

  • 模型推导过程中:

    记 d(v,w) 为v到w的距离(网格步数),则产生一条从v到w的随机边的概率与 d(v,w)^-q^ 成正比

    image-20220426200937474
  • 但是,在线社会网络如何体现均匀地理位置关系?
    不同节点的同“距离”圈中的节点数相同

    rank的定义:节点w在节点v眼里的排名,rank(w),等于网络中比w离v近的节点的个数

    把社会网络中的rank与地理距离中的d^2^类比

    rank小的在圆内==面积小的在圆内

    image-20220426202136749 image-20220426201818211
  • 互联网的地域性——虚拟空间距离与现实空间距离的等价性

    远程相邻节点的数量在同距离节点数中的占比随距离的平方减少

  • 另一个社会网络中的距离概念:社会距离

    image-20220426203315712

21章 传染病的网络宣传模型

树形模型(分支结构),SIR模型

  • 基本再生数:R0=概率p×遇到的人数k,由单一个体引起的新发病例数期望值

    如果R0<1,则疾病将以概率1在有限的过程后消失。如果 R0> 1,则疾病持续在每一波以一定的概率至少感染一个人

    image-20220426204316779
  • SIR模型

    image-20220426204716071

    与分支结构不同,这里不再有k这个参数。而是靠网络结构和时间步数来表达传染的过程。

    一条边表示,“在特定的时候,他们有接触”

    image-20220426214519478

手写的笔记