Python实现简单遗传算法(SGA)

yipeiwu_com5年前Python基础

本文用Python3完整实现了简单遗传算法(SGA)

Simple Genetic Alogrithm是模拟生物进化过程而提出的一种优化算法。SGA采用随机导向搜索全局最优解或者说近似全局最优解。传统的爬山算法(例如梯度下降,牛顿法)一次只优化一个解,并且对于多峰的目标函数很容易陷入局部最优解,而SGA算法一次优化一个种群(即一次优化多个解),SGA比传统的爬山算法更容易收敛到全局最优解或者近似全局最优解。
SGA基本流程如下:

1、对问题的解进行二进制编码。编码涉及精度的问题,在本例中精度delta=0.0001,根据决策变量的上下界确定对应此决策变量的染色体基因的长度(m)。假设一个决策变量x0上界为upper,下界为lower,则精度delta = (upper-lower)/2^m-1。如果已知决策变量边界和编码精度,那么可以用下面的公式确定编码决策变量x0所对应的染色体长度:

2^(length-1)<(upper-lower)/delta<=2^length-1

2、对染色体解码得到表现形:

解码后得到10进制的值;decoded = lower + binary2demical(chromosome)*delta。其中binary2demical为二进制转10进制的函数,在代码中有实现,chromosome是编码后的染色体。

3、确定初始种群,初始种群随机生成

4、根据解码函数得到初始种群的10进制表现型的值

5、确定适应度函数,对于求最大值最小值问题,一般适应度函数就是目标函数。根据适应度函数确定每个个体的适应度值Fi=FitnessFunction(individual);然后确定每个个体被选择的概率Pi=Fi/sum(Fi),sum(Fi)代表所有个体适应度之和。

6、根据轮盘赌选择算子,选取适应度较大的个体。一次选取一个个体,选取n次,得到新的种群population

7、确定交叉概率Pc,对上一步得到的种群进行单点交叉。每次交叉点的位置随机。

8、确定变异概率Pm,假设种群大小为10,每个个体染色体编码长度为33,则一共有330个基因位,则变异的基因位数是330*Pm。接下来,要确定是那个染色体中哪个位置的基因发生了变异。将330按照10进制序号进行编码即从0,1,2,.......229。随机从330个数中选择330*Pm个数,假设其中一个数时154,chromosomeIndex = 154/33 =4,
geneIndex = 154%33 = 22。由此确定了第154号位置的基因位于第4个染色体的第22个位置上,将此位置的基因值置反完成基本位变异操作。

9、以上步骤完成了一次迭代的所有操作。接下就是评估的过程。对变异后得到的最终的种群进行解码,利用解码值求得每个个体的适应度值,将最大的适应度值保存下来,对应的解码后的决策变量的值也保存下来。

10、根据迭代次数,假设是500次,重复执行1-9的步骤,最终得到是一个500个数值的最优适应度取值的数组以及一个500*n的决策变量取值数组(假设有n个决策变量)。从500个值中找到最优的一个(最大或者最小,根据定义的适应度函数来选择)以及对应的决策变量的取值。
对于以上流程不是很清楚的地方,在代码中有详细的注释。也可以自行查找资料补充理论。本文重点是实现
本代码实现的问题是: maxf(x1,x2) = 21.5+x1*sin(4*pi*x1)+x2*sin(20*pi*x2)
                         s.t. -3.0<=x1<=12.1
4.1<=x2<=5.8

初始种群的编码结果如下图所示:


初始种群的解码结果如下图所示:


适应度值如图所示:


轮盘赌选择后的种群如图所示;


单点交叉后的种群如图所示:


基本位变异后的种群如图所示;


最终结果如下图所示;


源代码如下;

# !/usr/bin/env python 
# -*- coding:utf-8 -*- 
# Author: wsw 
# 简单实现SGA算法 
import numpy as np 
from scipy.optimize import fsolve, basinhopping 
import random 
import timeit 
 
 
# 根据解的精度确定染色体(chromosome)的长度 
# 需要根据决策变量的上下边界来确定 
def getEncodedLength(delta=0.0001, boundarylist=[]): 
 # 每个变量的编码长度 
 lengths = [] 
 for i in boundarylist: 
  lower = i[0] 
  upper = i[1] 
  # lamnda 代表匿名函数f(x)=0,50代表搜索的初始解 
  res = fsolve(lambda x: ((upper - lower) * 1 / delta) - 2 ** x - 1, 50) 
  length = int(np.floor(res[0])) 
  lengths.append(length) 
 return lengths 
 pass 
 
 
# 随机生成初始编码种群 
def getIntialPopulation(encodelength, populationSize): 
 # 随机化初始种群为0 
 chromosomes = np.zeros((populationSize, sum(encodelength)), dtype=np.uint8) 
 for i in range(populationSize): 
  chromosomes[i, :] = np.random.randint(0, 2, sum(encodelength)) 
 # print('chromosomes shape:', chromosomes.shape) 
 return chromosomes 
 
 
# 染色体解码得到表现型的解 
def decodedChromosome(encodelength, chromosomes, boundarylist, delta=0.0001): 
 populations = chromosomes.shape[0] 
 variables = len(encodelength) 
 decodedvalues = np.zeros((populations, variables)) 
 for k, chromosome in enumerate(chromosomes): 
  chromosome = chromosome.tolist() 
  start = 0 
  for index, length in enumerate(encodelength): 
   # 将一个染色体进行拆分,得到染色体片段 
   power = length - 1 
   # 解码得到的10进制数字 
   demical = 0 
   for i in range(start, length + start): 
    demical += chromosome[i] * (2 ** power) 
    power -= 1 
   lower = boundarylist[index][0] 
   upper = boundarylist[index][1] 
   decodedvalue = lower + demical * (upper - lower) / (2 ** length - 1) 
   decodedvalues[k, index] = decodedvalue 
   # 开始去下一段染色体的编码 
   start = length 
 return decodedvalues 
 
 
# 得到个体的适应度值及每个个体被选择的累积概率 
def getFitnessValue(func, chromosomesdecoded): 
 # 得到种群规模和决策变量的个数 
 population, nums = chromosomesdecoded.shape 
 # 初始化种群的适应度值为0 
 fitnessvalues = np.zeros((population, 1)) 
 # 计算适应度值 
 for i in range(population): 
  fitnessvalues[i, 0] = func(chromosomesdecoded[i, :]) 
 # 计算每个染色体被选择的概率 
 probability = fitnessvalues / np.sum(fitnessvalues) 
 # 得到每个染色体被选中的累积概率 
 cum_probability = np.cumsum(probability) 
 return fitnessvalues, cum_probability 
 
 
# 新种群选择 
def selectNewPopulation(chromosomes, cum_probability): 
 m, n = chromosomes.shape 
 newpopulation = np.zeros((m, n), dtype=np.uint8) 
 # 随机产生M个概率值 
 randoms = np.random.rand(m) 
 for i, randoma in enumerate(randoms): 
  logical = cum_probability >= randoma 
  index = np.where(logical == 1) 
  # index是tuple,tuple中元素是ndarray 
  newpopulation[i, :] = chromosomes[index[0][0], :] 
 return newpopulation 
 pass 
 
 
# 新种群交叉 
def crossover(population, Pc=0.8): 
 """ 
 :param population: 新种群 
 :param Pc: 交叉概率默认是0.8 
 :return: 交叉后得到的新种群 
 """ 
 # 根据交叉概率计算需要进行交叉的个体个数 
 m, n = population.shape 
 numbers = np.uint8(m * Pc) 
 # 确保进行交叉的染色体个数是偶数个 
 if numbers % 2 != 0: 
  numbers += 1 
 # 交叉后得到的新种群 
 updatepopulation = np.zeros((m, n), dtype=np.uint8) 
 # 产生随机索引 
 index = random.sample(range(m), numbers) 
 # 不进行交叉的染色体进行复制 
 for i in range(m): 
  if not index.__contains__(i): 
   updatepopulation[i, :] = population[i, :] 
 # crossover 
 while len(index) > 0: 
  a = index.pop() 
  b = index.pop() 
  # 随机产生一个交叉点 
  crossoverPoint = random.sample(range(1, n), 1) 
  crossoverPoint = crossoverPoint[0] 
  # one-single-point crossover 
  updatepopulation[a, 0:crossoverPoint] = population[a, 0:crossoverPoint] 
  updatepopulation[a, crossoverPoint:] = population[b, crossoverPoint:] 
  updatepopulation[b, 0:crossoverPoint] = population[b, 0:crossoverPoint] 
  updatepopulation[b, crossoverPoint:] = population[a, crossoverPoint:] 
 return updatepopulation 
 pass 
 
 
# 染色体变异 
def mutation(population, Pm=0.01): 
 """ 
 
 :param population: 经交叉后得到的种群 
 :param Pm: 变异概率默认是0.01 
 :return: 经变异操作后的新种群 
 """ 
 updatepopulation = np.copy(population) 
 m, n = population.shape 
 # 计算需要变异的基因个数 
 gene_num = np.uint8(m * n * Pm) 
 # 将所有的基因按照序号进行10进制编码,则共有m*n个基因 
 # 随机抽取gene_num个基因进行基本位变异 
 mutationGeneIndex = random.sample(range(0, m * n), gene_num) 
 # 确定每个将要变异的基因在整个染色体中的基因座(即基因的具体位置) 
 for gene in mutationGeneIndex: 
  # 确定变异基因位于第几个染色体 
  chromosomeIndex = gene // n 
  # 确定变异基因位于当前染色体的第几个基因位 
  geneIndex = gene % n 
  # mutation 
  if updatepopulation[chromosomeIndex, geneIndex] == 0: 
   updatepopulation[chromosomeIndex, geneIndex] = 1 
  else: 
   updatepopulation[chromosomeIndex, geneIndex] = 0 
 return updatepopulation 
 pass 
 
 
# 定义适应度函数 
def fitnessFunction(): 
 return lambda x: 21.5 + x[0] * np.sin(4 * np.pi * x[0]) + x[1] * np.sin(20 * np.pi * x[1]) 
 pass 
 
 
def main(max_iter=500): 
 # 每次迭代得到的最优解 
 optimalSolutions = [] 
 optimalValues = [] 
 # 决策变量的取值范围 
 decisionVariables = [[-3.0, 12.1], [4.1, 5.8]] 
 # 得到染色体编码长度 
 lengthEncode = getEncodedLength(boundarylist=decisionVariables) 
 for iteration in range(max_iter): 
  # 得到初始种群编码 
  chromosomesEncoded = getIntialPopulation(lengthEncode, 10) 
  # 种群解码 
  decoded = decodedChromosome(lengthEncode, chromosomesEncoded, decisionVariables) 
  # 得到个体适应度值和个体的累积概率 
  evalvalues, cum_proba = getFitnessValue(fitnessFunction(), decoded) 
  # 选择新的种群 
  newpopulations = selectNewPopulation(chromosomesEncoded, cum_proba) 
  # 进行交叉操作 
  crossoverpopulation = crossover(newpopulations) 
  # mutation 
  mutationpopulation = mutation(crossoverpopulation) 
  # 将变异后的种群解码,得到每轮迭代最终的种群 
  final_decoded = decodedChromosome(lengthEncode, mutationpopulation, decisionVariables) 
  # 适应度评价 
  fitnessvalues, cum_individual_proba = getFitnessValue(fitnessFunction(), final_decoded) 
  # 搜索每次迭代的最优解,以及最优解对应的目标函数的取值 
  optimalValues.append(np.max(list(fitnessvalues))) 
  index = np.where(fitnessvalues == max(list(fitnessvalues))) 
  optimalSolutions.append(final_decoded[index[0][0], :]) 
 # 搜索最优解 
 optimalValue = np.max(optimalValues) 
 optimalIndex = np.where(optimalValues == optimalValue) 
 optimalSolution = optimalSolutions[optimalIndex[0][0]] 
 return optimalSolution, optimalValue 
 
 
solution, value = main() 
print('最优解: x1, x2') 
print(solution[0], solution[1]) 
print('最优目标函数值:', value) 
# 测量运行时间 
elapsedtime = timeit.timeit(stmt=main, number=1) 
print('Searching Time Elapsed:(S)', elapsedtime) 

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

python机器学习库xgboost的使用

python机器学习库xgboost的使用

1.数据读取 利用原生xgboost库读取libsvm数据 import xgboost as xgb data = xgb.DMatrix(libsvm文件) 使用sk...

使用Flask集成bootstrap的方法

使用Flask集成bootstrap的方法

1. 下载flask-bootstrap pip install flask-bootstrap 2. 找到base.html文件 将site-packages\flask_b...

解决python3中解压zip文件是文件名乱码的问题

在zip标准中,对文件名的 encoding 用的不是 unicode,而可能是各种软件根据系统的默认字符集来采用(此为猜测),因此zipfile中根据文件 flag 检测的时候,只支持...

Python中MYSQLdb出现乱码的解决方法

本文实例讲述了Python中MYSQLdb出现乱码的解决方法,分享给大家供大家参考。具体方法如下: 一般来说,在使用mysql最麻烦的问题在于乱码。 查看mysql的编码: 命令:&nb...

Django objects的查询结果转化为json的三种方式的方法

Django objects的查询结果转化为json的三种方式的方法

第一种方式: 利用seriallizers 这个方法,官网的解释说:将复杂的数据结构变成json、xml或者其他的格式 import json from django.core...