织梦dedecms爬虫,织梦dedecms使用教程

分类:建站教程 Dedecms教程 时间:2025-10-23 09:07 浏览:0 评论:0
0

当前目录列表:

  • 1、SEO如何做好网站框架优化
  • 2、DedeCMS怎么改成伪静态页面
  • 3、403错误怎么解决
  • 4、最近在自己学着用DedeCMS系统做网站,可是在病毒检测的时候,出现了一些可疑文件,不知道怎么处理啊?
  • 5、织梦Dedecms系统SEO优化之网站URL目录优化
  • SEO如何做好网站框架优化

    网站框架优化,是为了让网站更容易表达正确的内容,透过网站架构调整,能够让用户方便的浏览所有的站内信息,同时能够有效引导用户进行深入点击。

    框架优化,主要从用户角度出发,透过扁平化的阶层,让用户翻阅任意内容都可以在三层内寻找到答案。

    网站框架优化主要分为两种:

    1、物理架构

    2、逻辑架构

    符合企业站点的网站框架如下:

    透过首页就可达到网站任何一个顶级栏目、二级目录、最终内容页。

    任何一个页面都可以返回首页、上一层级或 任何一个顶级栏目。

    网站架构优化,通常会将网站架构形成树状结构,而为了让用户方便浏览以利用户体验,这个树状结构的层级不超过3层。另一方面,对于搜索引擎爬虫来说,若架构太深太多层,会不利搜索引擎抓取,因此层级保持在3阶是普遍认为最佳的方式。

    学好框架优化划重点:

    5种常见的SEO框架优化手法。

    ,1建立网站地图

    网站地图,Sitemap能够提交到百度管理工具,让搜索引擎能够有效的直接从Sitemap进行整个网站的抓取,快速且有效。

    ,2网站层级不超过3层

    网站层级过深,会造成用户想要进入到最终文章或产品页面时花费太长的时间,这样会导致用户难以找到想要的文章,或是找到一半就离开网站了,如此不但会增加网站跳出率,同时也会减少网站页面停留时间,甚至造成用户体验大幅下降等问题。

    ,3网站导航采用文字链接

    网站导航,Menu尽量采用文字链接,文字链接除了是搜索引擎最容易识别的方式之外,也是一般用户最常见最熟悉的链接方式,因此善用文字链接导向各阶层页面是最佳选择。

    ,4导航链接文字要符合内容

    网站导航链接,Menu Link一定要使链接文字与内容呈现一致性,若导航链接为”SEO教学“,那么链接至的下一层页面内容一定要是与“SEO教学”有高度相关性的内容。

    ,5多增加内部链接

    在每一个页面上增加内部链接能有效引导搜索引擎爬虫对整个网站的抓取,同时也能带动用户在观看页面内容时能链接到其他相关页面。,但切勿盲目将所有链接放置在所有页面上,不需要有意义的文字或段落链接至其他相关页面。

    ,6网站架构优化方法

    正常来说,文件的摆放也有学问。根据不同的内容与类型需要放置在不同的资料夹当中,同时目录名称也需要明确定义。举例来说:Image档案、Javascript档案、CSS档案…等,都需要放置在专属的资料夹当中与其他内容区隔开来。

    目录的名称仍建议使用有意义的英文来命名,目录的长度也应该越短越好,目录的架构也不要太深。

    DedeCMS怎么改成伪静态页面

    dede5.7伪静态设置七步法:

    第一步、后台-系统参数-核心设置-是否使用伪静态:选择“是”;

    注:你的网站空间是否支持伪静态,你可以与空间的IDC商联系一下,如果是自己的服务器,那就更好办了,自己动手,丰衣足食。一般来说,空间都是支持伪静态的。Apache服务器伪静态相对简单,直接在.htaccess文件中加入相应伪静态规则即可;而IIS服务器伪静态的实现,则需要加载Rewrite组件,然后配置httpd.ini文件。

    第二步、如果你的网站已经存在生成的静态栏目或文章HTML,那么只需在后台-系统-SQL命令行工具中执行如下语句:

    将所有文档设置为“仅动态浏览”:

    update dede_archives set ismake=-1

    将所有栏目设置为“使用动态页”:

     update dede_arctype set isdefault=-1

    第三步、列表页、文章页伪静态修改

    打开/include/helpers/channelunit.helper.php。

    ,1查找:

    if,$cfg_rewrite == 'Y'

    {

    return $GLOBALS["cfg_plus_dir"]."/view-".$aid.'-1.html';

    }

    替换为

    if,$cfg_rewrite == 'Y'

    {

    return "/DedeCMS/DedeCMS5.7-".$aid.'-1.html';

    }

    意思是:将默认的/plus/view-1-1.html文章链接格式改为/DedeCMS/DedeCMS5.7-1-1.html。

    ,2 查找:

    $reurl = $GLOBALS['cfg_phpurl']."/list.php?tid=".$typeid;

    替换为:

    $reurl = "/category/list-".$typeid.".html";

    意思是:将默认的频道或是列表页URL/plus//list.php?tid=1变更为/DedeCMS/list-1.html形式。

    第四步、列表分页伪静态修改

    打开/include/arc.listview.class.php

    查找:

    $plist = str_replace,'.php?tid=', '-', $plist;

    替换为

    $plist = str_replace,'plus/list.php?tid=', ‘DedeCMS/DedeCMS5.7-', $plist;

    将默认的plus/list.php?tid=替换成RMB/list-;

    意思是:将默认的列表分页链接格式plus/list.php?tid=x$x$xl修改为DedeCMS/DedeCMS5.7-x-x-x.html。

    第五步、文章分页伪静态

    打开/include/arc.archives.class.php,找到获取动态的分页列表GetPagebreakDM,函数末尾处:

    查找:

    $PageList = str_replace,"plus/view.php?tid=","DedeCMS/DedeCMS5.7-",$PageList;

    替换为

    $plist = str_replace,'plus/view.php?tid=', ’DedeCMS/DedeCMS5.7-', $plist;

    将默认的plus/view.php?tid=替换成RMB/huilv-;

    意思是:将默认的文章分页链接格式plus/view.php?tid=x$x$xl修改为DedeCMS/DedeCMS5.7-x-x-x.html

    第六步、TAG标签伪静态

    DedeCms默认的TAG标签URL,形如/tags.php?/DedeCMS模板 /,是不是觉得有个问号不怎么爽,我们改成/tags/DedeCMS模板 /,是不是好看多了。

    下面我们来改一下,打开/include/taglib/tag.lib.php:

    查找:

    $row['link'] = $cfg_cmsurl."/tags.php?/".urlencode,$row['keyword']."/";

    替换为

    $row['link'] = $cfg_cmsurl."/tags/".urlencode,$row['keyword']."/";

    这样就修改好了,上传你到你的网站,切记:要记得将原网站备份哦!!

    第七步、httpd.ini伪静态规则:

    [ISAPI_Rewrite]

    # 3600 = 1 hour

    CacheClockRate 3600

    RepeatLimit 32

    RewriteRule ^,.*/RMB/list-,[0-9]+\.html $1/plus/list\.php\?tid=$2 [I]

    RewriteRule ^,.*/RMB/list-,[0-9]+-,[0-9]+-,[0-9]+\.html $1/plus/list\.php\?tid=$2TotalResult=$3PageNo=$4 [I]

    RewriteRule ^,.*/RMB/huilv-,[0-9]+-,[0-9]+\.html $1/plus/view\.php\?arcID=$2pageno=$3 [I]

    RewriteRule ^,.*/,.*_,.*_,[0-9]+\.html $1/huilv/?from=$2to=$3num=$4 [I]

    RewriteRule ^,.*/tags\.html $1/tags\.php [I]

    RewriteRule ^,.*/tags/,.*,?:(\?.*)* $1/tags\.php\?\/$2 [I]

    RewriteRule ^,.*/tags/,.*\/,?:(\?.*)* $1/tags\.php\?\/$2\/ [I]

    RewriteRule ^,.*/tags/,.*\/,[0-9],?:(\?.*)* $1/tags\.php\?\/$2\/$3 [I]

    RewriteRule ^,.*/tags/,.*\/,[0-9]\/,?:(\?.*)* $1/tags\.php\?\/$2\/$3\/ [I]

    将上面代码保存为:httpd.ini 上传到网站的根目录。

    如无特特殊需求建议采用官方默认的生成静态的页面方式浏览。

    dedecms爬虫,dedecms使用教程

    403错误怎么解决

    一、403 forbidden是什么意思?

    403 Forbidden是HTTP协议中的一个状态码,Status Code。可以简单的理解为没有权限访问此站。该状态表示服务器理解了本次请求但是拒绝执行该任务,该请求不该重发给服务器。在HTTP请求的方法不是“HEAD”,并且服务器想让客户端知道为什么没有权限的情况下,服务器应该在返回的信息中描述拒绝的理由。在服务器不想提供任何反馈信息的情况下,服务器可以用404 Not Found代替403 Forbidden。

    二、403错误代码的分类介绍

    403.1

    403.1错误是由于"执行"访问被禁止而造成的,若试图从目录中执行CGI、ISAPI或其他可执行程序,但该目录不允许执行程序时便会出现此种错误。

    403.2

    403.2错误是由于"读取"访问被禁止而造成的。导致此错误是由于没有可用的默认网页并且没有对目录启用目录浏览,或者要显示的HTML网页所驻留的目录仅标记为"可执行"或"脚本"权限。

    403.3

    403.3错误是由于"写入"访问被禁止而造成的,当试图将文件上载到目录或在目录中修改文件,但该目录不允许"写"访问时就会出现此种错误。

    403.4

    403.4错误是由于要求SSL而造成的,您必须在要查看的网页的地址中使用"https"。

    403.5

    403.5错误是由于要求使用128位加密算法的Web浏览器而造成的,如果您的浏览器不支持128位加密算法就会出现这个错误,您可以连接微软网站进行浏览器升级。

    403.6

    403.6错误是由于IP地址被拒绝而造成的。如果服务器中有不能访问该站点的IP地址列表,并且您使用的IP地址在该列表中时您就会返回这条错误信息。

    403.7

    403.7错误是因为要求客户证书,当需要访问的资源要求浏览器拥有服务器能够识别的安全套接字层,SSL 客户证书时会返回此种错误。

    403.8

    403.8错误是由于禁止站点访问而造成的,若服务器中有不能访问该站点的DNS名称列表,而您使用的DNS名称在列表中时就会返回此种信息。请注意区别403.6与403.8错误。

    403.9

    403.9错误是由于连接的用户过多而造成的,由于Web服务器很忙,因通讯量过多而无法处理请求时便会返回这条错误。

    403.10

    403.10错误是由于无效配置而导致的错误,当您试图从目录中执行CGI、ISAPI或其他可执行程序,但该目录不允许执行程序时便会返回这条错误。

    403.11

    403.11错误是由于密码更改而导致无权查看页面。

    403.12

    403.12错误是由于映射器拒绝访问而造成的。若要查看的网页要求使用有效的客户证书,而您的客户证书映射没有权限访问该Web站点时就会返回映射器拒绝访问的错误。

    403.13

    403.13错误是由于需要查看的网页要求使用有效的客户证书而使用的客户证书已经被吊销,或者无法确定证书是否已吊销造成的。

    403.14

    403.14错误Web 服务器被配置为不列出此目录的内容,拒绝目录列表。

    403.15

    403.15错误是由于客户访问许可过多而造成的,当服务器超出其客户访问许可限制时会返回此条错误。

    403.16

    403.16错误是由于客户证书不可信或者无效而造成的。

    403.17

    403.17错误是由于客户证书已经到期或者尚未生效而造成的。

    三、导致403错误的主要原因

    1、你的IP被列入黑名单。

    2、你在一定时间内过多地访问此网站,一般是用采集程序,被防火墙拒绝访问了。

    3、网站域名解析到了空间,但空间未绑定此域名。

    4、你的网页脚本文件在当前目录下没有执行权限。

    5、在不允许写/创建文件的目录中执行了创建/写文件操作。

    6、以http方式访问需要ssl连接的网址。

    7、浏览器不支持SSL 128时访问SSL 128的连接。

    8、在身份验证的过程中输入了错误的密码。

    9、DNS解析错误,手动更改DNS服务器地址。

    10、连接的用户过多,可以过后再试。

    11、服务器繁忙,同一IP地址发送请求过多,遭到服务器智能屏蔽。

    四、解决403 forbidden错误的方法

    1、重建dns缓存

    对于一些常规的403 forbidden错误,马海祥建议大家首先要尝试的就是重建dns缓存,在运行中输入cmd,然后输入ipconfig /flushdns即可。如果不行的话,就需要在hosts文件里把主页解析一下了。

    2、修改文件夹安全属性

    用以下命令修改文件夹安全属性

    chcon -R -t httpd_user_content_t public_html/

    所用命令解析:

    ls -Z -d public_html/

    #显示文件/目录的安全语境-Z, --context

    Display security context so it fits on most displays. Displays only mode, user, group, security context and file name.-d, --directory

    list directory entries instead of contents, and do not dereference symbolic links

    chcon -R -t httpd_user_content_t public_html/

    #修改文件/目录的安全语境-R, --recursive

    change files and directories recursively-t, --type

    set type TYPE in the target security context

    3、关于apache导致的403 forbidden错误的解决办法

    打开apache的配置文件httpd.conf,找到这段代码:

    Options FollowSymLinks

    AllowOverride None

    Order deny,allow

    Deny from all

    有时候由于配置了php后,这里的“Deny from all”已经拒绝了一切连接。把该行改成“allow from all”,修改后的代码如下,问题解决。

    Options FollowSymLinks

    AllowOverride None

    Order deny,allow

    Allow from all

    之所以会出现错误,是因为大多数的国外主机在配置Apache的时候启用了mod_security,也就是开启了安全检查,如果提交的信息中包含select , % , bin等关键字,Apache就会禁止,并给出403,404,500等错误。

    4、关于HawkHost空间出现403 Forbidden错误的解决方法

    有的时候在共享服务器上安装了Mod security,当网址包含有“%”号等其它敏感字符时,就会被Mod security阻止,马海祥博客曾经也出现过此情况。

    解决HawkHost 403 Forbidden 错误的方法:

    在.htaccess文件里添加如下代码:

    SecFilterEngine Off

    SecFilterScanPOST Off

    直接放在网站的根目录或者程序运行的目录下。

    5、关于WordPress导致的403 Forbidden错误解决方法

    对于一些使用WordPress管理程序搭建的博客来说,就需要修改.htaccess文件,在后面添加上如下内容即可,其实就是disable mod_security

    SecFilterEngine Off

    SecFilterScanPOST Off

    另外DedeCMS的可能还需要再加一条,以让默认访问的是index.html文件的DirectoryIndex index.html。

    修改.htaccess文件,将文件上传之后,再重新打开之前出现403 Forbidden的URL就没有再出现错误,直接可以打开了。

    最近在自己学着用DedeCMS系统做网站,可是在病毒检测的时候,出现了一些可疑文件,不知道怎么处理啊?

    推荐的答案简直牛头不对马嘴,出现这种问题最好的解决方式就把后台删除,重新上传一下后台。出现可疑文件的原因可能是文件被人为的修改过跟原来DEDECMS的初始文件不一样,也并不代表就一定是木马,当然前提是你有修改过文件

    织梦Dedecms系统SEO优化之网站URL目录优化

    1:织梦CMS国内第一大开源程序,系统成熟,利于开发上手。WEB应用中织梦占比30%,WP占比20%,DZ占比13%,帝国CMS占比5.7%。

    2:占用服务器资源少,性能优越。

    3:前端模板做到精简,利于搜索爬虫抓取。

    4:URL可静态化,目录及文件名可通过后台设置。

    5:缺点是手机站是M目录形式,需二次改进或做独立系统手机站。适配教麻烦,尽可能选择响应式模板,用自适应方式完成移动适配。

    1. 本站所有资源来源于用户上传或网络,仅作为参考研究使用,如有侵权请邮件联系站长!
    2. 本站积分货币获取途径以及用途的解读,想在本站混的好,请务必认真阅读!
    3. 本站强烈打击盗版/破解等有损他人权益和违法作为,请各位会员支持正版!
    4. 建站教程 > 织梦dedecms爬虫,织梦dedecms使用教程

    用户评论