李娜吧 关注:6,866贴子:445,544

对悲观的和乐观的朋友们说

只看楼主收藏回复

自打除夕晚上(零点前吧)在毁吧者的环伺下,与在这里孤独徘徊的揽姐简单贴聊几句并劝她回去休息后,又是十天没来这里了。看到目前这个样子,和大家一样忧心。
我是个电脑盲大家都知道的,但我可以找行家问一问,转述他们的看法是吧?刚才与一位在特殊岗位上从事网络安全工作的中年专家(我称他大侠)咨询了一下,现在我把关于数据恢复方面的一些我能听明白的事说说。(保密和追索黑客内容从略)在转述过程中,如有知识上的笑话,那一定是我这个马马虎虎的文人的幼稚。如果有一些话能让大家走出绝望心境,又能放弃不切实的幻想,都恢复到一颗平常心,那就是我的本意了——



1楼2012-01-29 20:38回复
    先对悲观的朋友说一下哈。大侠认为,从理论和实践上说,我们这里被删除的所有数据,目前都还在的,并且百度有能力全部恢复。百度这些年来,资金投入的很大一块,就是在数据保存方面。目前可说是卓有成效,国内一家独大。但是——


    2楼2012-01-29 20:39
    回复
      2025-05-21 08:42:42
      广告
      对过于乐观的朋友,大侠则说,在实际上,要有心理准备,贴吧里的数据会有相当的损失,原因是以下几点:
      1 、百度可能是以几十、几百T、上千T为单元,进行资料的保存、检索和恢复的,并且不言而喻会分类。像我们的主题楼,无论高低,一经删除,就全部分解了。文字、图片、音频、视频等,各按照百度的自设的分类,去找自己的同伴,真正天各一方了。甚至可打比方说,某主题高楼的文字在北京的数据库(也可能全部文字都不能在一处),而视频文件却保存到山西某二线城市,音频文件却去了湖南。。。(大侠解释说,北京土地资源太昂贵,仅一个小“当当”网的数据库,就占了北京某处高端写字楼的两层半面积。所以,这么庞大的百度,从成本考虑,就会在二三线城市发展他们的数据库。)


      3楼2012-01-29 20:40
      回复
        繁复吗?也没什么的,对计算机来说,恢复数据,有时真就是一键还原的事儿,它不管你在哪里,指令对头,一声呼唤,你在山沟里,也瞬间回来报到了。但问题就在这里——
        百度因此有它特殊的识别、检索和恢复程序(系统?),由此也给我们带来了专有的申报格式。这里确实是失之毫厘,谬之千里的。这就是贴吧应急的管理员所反复强调的,让我们必须按照他们给出的固定格式,正确申报。否则系统不能正确识别,当然不能恢复或完整恢复。


        4楼2012-01-29 20:41
        回复
          2、,就算是我们全部正确地申报了,所有的恢复程序都无问题,但因为全国信息海量,数据库的管理水平、人员的技术操作水平和硬件维护等诸多差异,仅一个环节出现问题就可能造成损失,比如说,传输过程中,某一处的延迟都可能出现传送失败。以致数据还原的不完整。


          5楼2012-01-29 20:42
          回复
            3、即便如此,百度仍有能力恢复全部丢失的数据,完整准确到每一字每一标点符号。但这要有一个先决条件————必须是执法机构对丢失的数据的重要性以及可能造成的损害,做出充分评估,并向百度提出要求,百度才有可能调集精兵良将运用一切高端技术认真对待。而据大侠看,我们这个贴吧及其资料内容,目前不具备这种特权。所有,百度只是会出于保护贴吧的信誉和网友的利益,尽可能地、量力而行地为我们做数据恢复。


            6楼2012-01-29 20:43
            回复
              4、有些数据,总库也不会永久保存,大侠说,一个月或数月之后,数据库的某清理系统,也会自动地删除一些“它所认为的”的垃圾信息。如果这些数据从库里也彻底清除掉,就算不是永久的空间蒸发,再找回来只能凭运气了。所以,一个月后,三个月后,半年以后。。。恢复的数据,不是没有数量递减的可能性。


              7楼2012-01-29 20:44
              回复
                5 、我非常重视这一点,所以在结束转述时才提到——
                根据目前我最担心的吧内自行部分恢复的提问,大侠回答:因为要处理海量信息,所以在恢复过程中,批量处理是常用的办法。其间,如果网友个人利用部分贴吧权限,做局部恢复,不仅内容是残缺的,而且确定会对百度的计算机识别程序和恢复程序带来了干扰。(因为,我们自己恢复了的主题楼,与已上报ID的删贴情况,不相附合了)
                (大侠下面的话,有些恐怖,我是将信将疑的,认为大侠是在吓唬人)
                ——在计算机按照它的特殊程序做恢复的过程中,如果遇到的干扰太大太固执,“它”也会生气的。有可能对相关的ID痛下杀手(永久封号),以继续它的正常工作。(别封ID啊,你用你恢复来的完整数据覆盖叶子恢复的残缺数据不行吗?)


                8楼2012-01-29 20:45
                回复
                  2025-05-21 08:36:42
                  广告
                  综上所述,我认为,就算大侠所说的只有50%靠谱,也可以对结果做出基本判断了:娜吧的22 万5 千多贴子,会有相当一部分得到恢复,还有一些就是不敢想不忍言了。。。
                  其实,预见到这种可能性,让我们有些思想准备,并不是坏事。我们就可以一方面按照人家的要求准确无误地做好申报,争取减少损失。另一方面,压一压心中的怒火,至少别再跟百度起急了,我们现在需要的帮助,首先是百度的帮助。想起了几年前关于“非典”的一部电视剧里的台词——当有些事情,你不能改变它的时候,就先平静下来,然后积极地面对吧。


                  9楼2012-01-29 20:46
                  回复
                    补充说明一下,上面所说的大侠,并不是百度的工作人员,开玩笑地说他是“大内高手”好了。所以我认为,毕竟他不是百度内部的人员,不是一个系统的,说出来的话就只能做参考。并且,他主要是做网络保密工作,业务强项不是数据管理和恢复。如果以后有机会碰到百度“数据恢复”方面的专家,我再进一步咨询好了。


                    10楼2012-01-29 20:48
                    回复
                      就先转述这些。由于我是电脑盲,其中我理解错的、术语用错的地方一定很多。上面这些嘛,虽是小儿科,但我觉得至少还是有一点点信息量可用来分析我们目前的处境的。写这种东西,我本就很吃力,看在和大家同心同命运的份上,不当之处请原谅吧。
                      俗务太多,艰难时期不能陪大家共患难,真是抱歉。先下了。朋友们,高兴一些,加油!


                      11楼2012-01-29 20:50
                      回复
                        关兄过年好!感谢你花这么多时间和精力为恢复贴子一事咨询专家,眼下大家太需要这方面的知识了。


                        IP属地:北京12楼2012-01-29 21:09
                        回复
                          关注大哥转述的很完整,莫非做了笔记?我去应急吧看了,有许多拆吧的,如果百度按每个贴吧备份,恢复起来当然如有些人所说的:一键还原,但百度这样备份可能代价较高,所以一旦他采用其他分类备份方法,恢复起来可能效果与预期相差甚远。


                          IP属地:河南来自掌上百度13楼2012-01-29 21:11
                          回复
                            最坏的估计,娜吧本次帖子数量可能减少十万。


                            IP属地:河南来自掌上百度14楼2012-01-29 21:13
                            回复
                              2025-05-21 08:30:42
                              广告
                              我一再跟叶子说,不要忙着手工恢复,等百度上班再说,不知道她听进去没有。


                              IP属地:北京15楼2012-01-29 21:13
                              回复